• No results found

Effektjakt och Nya Belastningskurvor för E.ON Energidistribution

N/A
N/A
Protected

Academic year: 2022

Share "Effektjakt och Nya Belastningskurvor för E.ON Energidistribution"

Copied!
31
0
0

Loading.... (view fulltext now)

Full text

(1)

MAT-VET-F 20015

Examensarbete 15 hp Maj 2020

Effektjakt och Nya Belastningskurvor för E.ON Energidistribution

Isak Voltaire Edoh

Gabriel Evensen

Jerker Kanon

(2)

Teknisk- naturvetenskaplig fakultet UTH-enheten

Besöksadress:

Ångströmlaboratoriet Lägerhyddsvägen 1 Hus 4, Plan 0

Postadress:

Box 536 751 21 Uppsala

Telefon:

018 – 471 30 03

Telefax:

018 – 471 30 00

Hemsida:

http://www.teknat.uu.se/student

Abstract

Effektjakt och Nya Belastningskurvor för E.ON Energidistribution

Isak Voltaire Edoh, Gabriel Evensen, Jerker Kanon

Det svenska elsystemet står inför nya utmaningar och problem när samhället utvecklas och byggs ut i dagens snabba takt, för att elföretag ska hinna ikapp med denna

utveckling krävs en vetskap om förbrukningsmönster och konsumentbeteende. Syftet med detta projekt var att tillsammans med E.ON Energidistribution, analysera elförbrukningsdata och ge E.ON nya inblickar i den nuvarande samt framtida konsumtionsutvecklingen.

I första delen av projektet tas lastprofiler fram med avseende på olika SCB-koder och säkringsstorlekar, detta utifrån E.ONs redan klustrade data. I den andra delen läggs fokus på att ta fram egna kluster med K-means för att i sin tur ta fram nya lastprofiler.

Slutsatser kan inte dras om de nya klustringsmetoderna är bättre än E.ONs, däremot har intressanta mönster upptäckts.

Ämnesgranskare: Teresa Zardán Gómez de la Torre

Handledare: Martin Karlsson

(3)

Innehåll

1 Populärvetenskaplig sammanfattning 1

2 Introduktion 3

2.1 Bakgrund . . . . 3

2.1.1 SCB/SNI-koder . . . . 4

2.1.2 Säkringsklasser . . . . 5

2.1.3 Typ av förbrukningsplats . . . . 5

2.1.4 Kund-ID . . . . 6

3 Syfte och målsättning 6 4 Teori 7 4.1 Del 1 . . . . 7

4.2 Del 2 . . . . 7

4.2.1 Klustringsmetoder . . . . 8

4.2.2 Val av kluster . . . . 10

5 Metod 11 5.1 Data . . . . 11

5.2 Verktyg . . . . 13

5.3 Del 1 . . . . 14

5.4 Del 2 . . . . 14

6 Resultat 15 6.1 Del 1 . . . . 15

6.2 Del 2 . . . . 17

7 Diskussion 21 7.1 Utvärdering av E.ONs nuvarande metod . . . . 21

7.2 Analys av kluster 1 . . . . 21

7.3 Analys av kluster 2 . . . . 23

7.4 Analys av kluster 3 . . . . 24

8 Slutsatser 26

(4)

1 Populärvetenskaplig sammanfattning

Det svenska energisystemet är uppdelat i tre områden vilka är stamnätet, regionnätet och lokalnätet. E.ON är ett företag som distribuerar el på lokal nivå samt en av de största ak- törerna inom regionnätsverksamhet i Sverige. Utvecklingen i det svenska samhället har på den senaste tiden gått fort fram. Kraftig expansion av storstadsregioner i kombination med elektrifiering av samhället som just nu sker har medfört en kapacitetsbrist i delar av det svenska elnätet. Kapacitetsbrist uppstår när den producerade elen ska transporteras från produktion till företag och hushåll.

Den bristande kapaciteten i stamnätet, framför allt till de största förbrukningsregionerna, leder till att regionnätsägarna inte kan abonnera mer effekt. Detta medför således att de lokala nätägarna har problem att teckna avtal och ansluta nya kunder till elnätet. På vissa lokal ställen så som i Stockholm är det även kapacitetsbrist i regionnätet som också håller på att byggs ut och förnyas. Den långsiktiga lösningen till denna kapacitetsbrist är att bygga ut både stamnätet och regionnäten.

Då en utbyggnation är tidkrävande måste problemet få en mer omgående lösning. För att optimera användandet av den befintliga kapaciteten i elnätet samt att genomföra bästa möjliga nätutbyggnad utifrån samhällsekonomiska aspekter är det avgörande att förstå nätkunders konsumtionsbeteende av el. Förståelsen är viktig för att få en mer aktuali- serad helhetsbild över hur elnätet används och möjliggör att förutse hur nya potentiella nätkunder skulle påverka det befintliga elnätssystemet.

I sammarbete med E.ON Energidistribution består detta projekt av att generera last- profiler som representerar olika kundgruppers konsumtionsbeteende av el. En lastprofil beskriver ett karaktäristiskt konsumtionsbeteende av el över året och veckodagar samt en analys över vilka typer av kunder profilen representeras av. Rådata som behandlas i projektet kommer från E.ON och består av energiförbrukning i kilowatt för varje timme.

Totalt finns det rådata för 8515 olika kunder under åren 2018 och 2019 samt ett antal attribut som kunderna klassificeras enligt.

Pojektet består av två delar. I den första delen tas lastprofiler fram utifrån E.ONs nu- varande metod. Denna metod delar in kunderna i grupper utifrån vilken SCB-kod och säkringsstorlek kunderna har i det dataunderlag som studeras. SCB-kod är en standard hos E.ON som ligger till grund för att gruppera kunder med liknande konusmtionsbe- teende av el. Säkringsstorleken beskriver den installerade effekten hos varje kund och fungerar som ett skydd för att inte överbelasta de elsystem som är kopplat till kunden.

Utifrån denna metod genereras 16 lastprofiler kopplade till en unik SCB-kod samt 6

lastprofiler kopplade till en unik säkringsstorlek.

(5)

I den andra delen av projektet studeras kluster-algoritmer med syftet att generera nya lastprofiler baserat endast på förbrukningsdata hos kunderna. Dessa algoritmer genererar delmängder av data som benämns som kluster. Metoden för dessa algoritmer baserar sig på maskininlärning och fungerar som ett kraftfullt verktyg för att analysera och hitta nya mönster i stora datamängder. När de kluster innehållande nya grupper av kunder har genererats kan dessa analyseras i syfte att skapa lastprofiler.

Slutligen jämförs lastprofilerna från den andra delen av projektet med de lastprofiler som

genererats i första delen av projektet. Det är svårt att dra slutsatser om vilken metod som

ger de bästa lastprofilerna. Lastprofilernas standardavvikelsen är relativt likvärdiga i de

båda metoderna. Däremot har en del av de nya lastprofilerna intressanta mönster vilket

kan öka förståelsen av olika konsumentbeteenden. Det visade sig att med en kombination

av SCB-kod, säkringsstorlek och fastighetstyp, är det möjligt att få en tydligare och mer

aktualiserad bild av hur en ny potentiell kund kommer bete sig. Detta istället för att

enbart utgå ifrån kundens SCB-kod eller säkringsstorlek.

(6)

2 Introduktion

2.1 Bakgrund

I dagens Sverige går utvecklingen snabbt framåt vilket leder till att städer och samhällen växer. En essentiell del för fortsatt utvecklingen är att det finns tillgång till el som kan driva bostäder, industrier och infrastruktur.

Sverige börjar komma till en punkt då det uppkommer svårigheter att bygga ut städer i och med kapacitetsbristen i elnäten som uppstått den senaste tiden. Denna brist betyder inte att det produceras för lite el, utan snarare att stamnätet och regionnäten inte kan leverera den önskade effekten. Det svenska stamnätet började att byggas ut på 20-talet och utvecklades sedan ytterligare mellan 60- och 80-talet. På fyrtio år har stora föränd- ringar skett angående hur befolkningen samt industrier förbrukar el, som till exempel användningen av internet och framväxten av eldrivna fordon. Dessa förändringar leder till kapacitetsproblem. En långsiktig lösning till den begränsade kapaciteten är att bygga ut stamnätet och regionnäten, något som håller på att göras men förväntas ta lång tid [1]. Till följd av kapacitetsbristen som uppstått i många regioner kommer den svenska eldistributören E.ON ha svårigheter att skriva nya elavtal innan utbyggnadprocessen av elnätet är färdigställt. Den rådande situationen är inte optimalt för ett samhälle som inte helt vill stanna upp i sin utveckling. Effektbristen kan dock minimeras genom att opti- mera användningen av det befintliga elnätet. För att göra detta krävs en grundläggande förståelse över hur kunderna konsumerar el över tid.

Varje kund i E.ONs databas har fyra olika attribut kopplat till sig: SCB-kod, säkrings-

klass, förbrukningsplas och kund-ID. Var och en av dessa attribut innehåller underkate-

gorier som beskriver en kunds förväntade konsumtion av el. Två av attributen ligger till

grund för E.ONs nuvarande metod att dela in kunder med likartat konsumtionsbeteende

i grupper. Metoden används i syfte att undersöka om ytterligare kapacitet finns för att

ansluta nya kunder, och består i att dela in kunder i grupper utifrån säkringsklass och

SCB-kod vilket medför vissa nackdelar. En nackdel med denna typ av gruppindelning

uppstår när en kunds förbrukningsmönster förändras utan att informationen i databasen

uppdateras. Det kan uppstå om exempelvis ett fritidshus omvandlas till permanentbo-

ende, i de flesta fall får E.ON inte vetskap om detta. Ett annat vanligt förekommande

exempel är om en kund växlar mellan ex fjärrvärme och eldriven värme. En annan nack-

del med denna metod är att två kunder med väldigt olika konsumtionsbeteenden kan ha

samma säkringsklass. Nackdelarna leder till att kunder kan sorteras in i samma grupp

fastän de konsumerar el väldigt annorlunda både med avseende på vilken tid på året samt

vilken tid det är på dagen. E.ON behöver därför en ny metod som delar in deras kunder

(7)

i nya grupper så att det blir tydligare hur en viss typ av kunds elförbrukning ser ut. Nya eventuella kunder kan bli inlagda i ett av dessa kluster vilket gör det tydligt att se om nya avtal kan skrivas utan att det leder till kapacitetsbrist i elnätet.

Utifrån den information om kunder som E.ON har samlad i sin databas kommer diverse kluster-algoritmer användas i detta projekt i syfte att ta fram nya kundgrupper. Dessa kundgrupper benämns som kluster. E.ON har ett sofistikerat system för att samla in all kunddata. Förbrukningsdatan samlas in från kunderna varje timme, vilket resulterar i en tidsserie som gör att man enkelt kan se när på dygnet och på vilken del av året som kunden förbrukar mycket respektive lite el, det vill säga en lastkurva. I och med att det är en stor kundbas är det en alltför tidskrävande process för en eller flera personer att jämför och göra grupper med kunder med liknande elkonsumtion. Istället används klustring-algoritmer. Det är maskininlärningsmetoder som jämför data och parar ihop elkonsumenter med liknande egenskaper i kluster. Det är en användbar metod då det gör det möjligt för E.ON att enbart studera några få kluster för att få en bild av hur deras kunders elkonsumtion ser ut istället för att granska alla deras tusentals kunder separat.

För att genererade kluster ska vara användbara måste de specifika karaktärsdragen i klustrens underliggande dataunderlag identifieras. Lastprofiler utformas och potentiella nya kunder kan kopplas till dessa. En lastprofil beskriver ett karaktäristiskt konsumtions- beteende av el över året och veckodagar samt en analys av vilka attribut elkonsumenter i denna profil består av. Tillgänglig information om attribut hos en potentiell ny kund kan kopplas till denna profil och den nya kundens inverkan på det befintliga elnätet kan på så sätt realiseras. De fyra attribut som nämnts i detta avsnitt är centrala i projektet och begreppens innebörd förklaras nedan.

2.1.1 SCB/SNI-koder

Statistiska centralbyrån (SCB) är en svensk myndighet som har hand om officiell statistik och ansvarar för SNI-koder. SNI står för standard för svensk näringsgrensindelning. Det är en femsiffrig kod som används för att klassificera företag med avseende på vilken typ av verksamhet de driver. I Sverige finns det 821 SNI-koder som är indelade i 21 stycken avdelningar som fokuserar på olika områden. Koderna kombineras för att på bästa sätt beskriva ett företag. De hämtas in av Skatteverket då ett företag registrerar verksamheten. Skatteverket lämnar sedan vidare uppgifterna till SCB.

SNI blev standard för svensk näringsindelning från och med år 2008. Denna standard

har ej helt blivit etablerad inom E.ON:s verksamhet och därför saknar många kunder i

E.ON:s databas en tillhörande SNI-kod. Istället använder sig E.ON av en äldre standard

som ligger till grund för att kategorisera kunders elkonsumtion, en så kallad SCB-kod.

(8)

I detta projekt kommer 16 olika SCB-koder behandlas, dock kan det uppstå problem med denna kategorisering. Problematiken uppstår då elnätskunder ändrar förbruknings- beteende utan att E.ON uppdaterar SCB-koderna. Det leder till att många SCB-koder är föråldrade och att kunder med samma kod kan konsumera el på helt skilda sätt.[2].

2.1.2 Säkringsklasser

E.ON sorterar även sina kunder baserat på säkringsstorlek. Alla fastigheter som blir för- sedda med el har en huvudsäkring som varierar i storlek. Huvudsäkringen fungerar som ett skydd för en anläggning samt bestämmer den mängden ström som kan tas ut på sam- ma gång. Skulle ett fel inträffa och en anläggning får för mycket ström går säkringen sönder vilket leder till ett strömavbrott. Säkringsstorleken mäts i ampere och storleken hänger ihop med elförbrukningen, där större elförbrukning kräver en större säkrings- storlek. För att välja huvudsäkring räcker det inte bara att undersöka den årliga elför- brukningen utan även granska hur och när elen förbrukas. Skulle till exempel en kund förbruka en stor mängd energi under en kort del av året så måste den ha en säkrings- storlek som kan hantera maxuttaget. Det skulle betyda att huvudsäkringen är större än nödvändigt resterande del av året. I och med att E.ON använder säkringsstorlek som en sorteringsmetod uppkommer därför problematik eftersom att två kunder som spenderar sin el på helt olika sätt ändå kan ha samma säkringsstorlek. Det betyder att det kan upp- stå svårigheter att förutse hur en ny kund kommer att spendera sin el genom att enbart granska dess säkringsstorlek. [3].

2.1.3 Typ av förbrukningsplats

Förbrukningsplats beskriver vilken typ av fastighet den elmätare som samlar in förbruk-

ningsdata är placerad i. De typer av förbrukningsplatser som behandlas i detta projekt

beskrivs i Tabell 1 nedan. Notera att AVKOPP samt HAVHM är okända då dessa saknar

förklaring.

(9)

Förbrukningsplats Förklaring

MAST Telemaster

SH Småhus (villor och parhus)

JORDB Jordbruk

IND Industri

FH Fritidshus

AVKOPP Okänd

LGHM Lägenhetsmätare

HAVM Okänd

FAST Fastighetsmätare i flerbostadshus

GBL Gatubelysning

ÖVR Övrigt

Tabell 1: Förklaring och typer av förbrukningsplatser.

2.1.4 Kund-ID

De kunder vars energiförbrukning som studeras i detta projekt består av två kategorier, näringsidkare (N) samt privatperson (P). En privatperson är en person som enbart repre- senterar sig själv som person och en näringsidkare är någon som driver en verksamhet.

3 Syfte och målsättning

Det här projektet kommer att bestå av två delar. I del 1 utvärderas E.ONs nuvarande me- toder för att bilda kluster av lastkurvor och se om någon slutsats kan dras angående deras kunders förbrukning. I del 2 konstrueras en ny klustringsmetod med begripliga mönster som kan ge tydligare lastkurvor vilket sedan kan användas för att förbättra E.ONs pro- gnosmodeller. Syftet med projektet är att konstruera en klustringsmetod som kommer att ge E.ON en klarare bild av deras kunders beteende. Metoden kommer i sin tur att fungera som underlag till prognoser samt som hjälpmedel till att teckna nya elavtal.

Målsättningen för rapporten är följande:

• Ta fram lastprofiler för olika kundgrupper utifrån SCB-koder och för säkrings-

storlekar (16, 20, 25, 35, 50, 63 A) från E.ONs redan klustrade data.

(10)

• Ta fram egna kluster för att kategorisera de kunder med liknande användarmönster, för att sedan ta fram nya lastprofil utifrån dessa kluster.

• Jämföra E.ONs lastprofiler utifrån deras egna kluster med detta projekts framtagna lastprofiler utifrån nyskapade kluster.

4 Teori

I det här kapitlet redogörs teori för del 1 samt del 2 av projektet. Dessutom diskuteras olika metoder för klusteranalys och hur antalet kluster kan väljas.

4.1 Del 1

I projektets första del ska E.ONs befintliga kundgrupper undersökas. Den första kundklassificering-modellen som E.ON använder sig av utgår från olika SCB-koder som kan översättas till en viss kundgrupp. Den andra kundklassificering-modellen består av abonnerad säkringsklass. I det här projektet ingår säkringsklasserna 16, 20, 25, 35, 50 och 63 A . För att utvärdera modellerna konstrueras typkurvor för de olika kundgrup- perna. För att få en lättförståelig bild över komsumtionsbeteendet för olika kundgrupper med utgångspunkt från de olika egenskaperna ovan, visualiseras lastkurvorna varje tim- me av vardag och helgdag samt en årlig konsumtion indelad i fyra kvartal. Lastprofilerna tas fram genom medianen och standardavvikelsen för varje enskild timme i varje kluster.

4.2 Del 2

I den andra delen ska en klustringsmetod konstrueras som kan med högre noggrannhet

bilda kluster av kunder än E.ONs nuvarande. Det här kapitlet kommer att gå genom

teori vad klusteranalys och klustring är. Klusteranalys eller klustring är ett område inom

datavetenskap och statistik som används för att utforska och analysera data. Detta genom

att gruppera liknande datapunkter i så kallade kluster. Klusteranalys är populärt inom

maskininlärning och datautvinning och det finns många olika metoder för att klustra

data, de vanligaste är: hierariskklustring, centroidklustring och densitetsklustring.

(11)

4.2.1 Klustringsmetoder

Principen bakom Hierariskklustring är att datapunkter relateras mer till närliggande da- tapunkter än till datapunkter längre bort, på så vis skapas ett kluster baserat på avstånd.

Detta kluster kan då beskrivas av det maximala avståndet som krävs för att sammanbinda alla datapunkterna. Således för olika avstånd kommer olika kluster att skapas vilket kan representeras i ett dendrogram, se Figur 1b. Resultatet är en hierarkisk struktur av kluster där varje enstaka objekt längst ner i dendrogramet leder tillbaka till en och samma rot.

(a) Datapunkterna klustras ihop baserat på av- stånd, två tydliga kluster här är ABC och DE.

(b) Dendrogram av klustrerna, tydlig hierarisk stuktur syns här.

Figur 1: Illustration av hierarisk klustring.

Centroidklustring är en av de mest populära och enklaste klustringssmetoden. Här repre- senterar centroider den vanligaste datapunkten i ett kluster och befinner sig i mitten. Till skillnad från andra klustringsmodeller kräver centroidklustring att antalet kluster speci- ficeras i förväg.. En vanlig algoritm för centroidklustring är K-means, som är populär för dess simplicitet samt snabbhet. Metoden är uppdelad i fyra steg, Figur 2 går igenom de olika stegen i bildform. Det första steget är att det förbestämda antalet centroider skapas och placeras slumpmässigt i det rum där datan befinner sig. Det andra steget är att kluster C i bildas, där ett kluster består av datapunker som ligger närmast en av centroiderna c i . Nästa steg är att centroiden placeras i masscentrum för alla punkter som är med i dess kluster varpå att c i beräknas med ekvation 1. I ekvationen är x datapunkter som tillhör kluster C i

c i = 1

|C i |

x ∈C

i

x. (1)

(12)

Det fjärde och sista steget i metoden är att steg två och tre upprepas tills alla centroider c i inte längre ändras av ekvation 1 [4].

(a) Steg 1 (b) Steg 2

(c) Steg 3 (d) Resultat efter ett antal iterationer.

Figur 2: Visualisering av hur K-means fungerar.

Densitetsklustring är metoder som använder sig av densitetsbaserade algoritmer som lo-

kaliserar områden där tätheten av datapunkter är hög. Ett exempel på en sådan metod

är DBSCAN, se Figur 3 som illustrerar metoden. Figuren 3a visar datapunkter som är

placerade i ett två dimensionellt rum. Metoden börjar genom att en slumpmässig obe-

handlad datapunkt utses. Ifall punkten har ett tillräckligt antal grannar blir punkten en

kärnpunkt och ett kluster bildas. En kärnpunkt är en punkt som har minst ett förbestämt

antal grannar och har förmågan att lägga till flera datapunkter i klustret. Det är möjligt

om datapunkterna ligger inom avståndet ϵ från en kärnpunkt. I exemplet i Figur 3 är

kravet för att vara en kärnpunk att ha minst 4 grannar inklusive sig själv, i Figur 3b är

kärnpunkter markerad som en röd datapunkt. När det inte finns några datapunkter inom

det bestämda avståndet från klustrets kärnpunkter går metoden vidare till en ny obe-

handlad datapunk och konstruktionen av ett nytt kluster påbörjas. Punkter som inte är

inom avståndet från någon kärnpunkt blir inte tillagt i ett kluster utan anses vara brus, i

Figur 3b är brus markerad som en svart punkt. Metoden fortsätter tills alla datapunkter

har blivit behandlade [5].

(13)

(a) Innan klustring. (b) Efter klustring.

Figur 3: Visualisering av hur DBSCAN fungerar.

4.2.2 Val av kluster

Det finns det många klustringsmetoder som fungerar på olika sätt men försöker uppnå samma mål. Vissa av dessa metoder väljer själv ett lämpligt antal kluster som mätdatan blir indelad i medan andra metoder kräver antalet kluster som indata. K-means och K- medoids är exempel på sådana metoder. Det kan vara svårt att dra en slutsats hur många kluster som mätdatan borde bli indelade i genom att enbart studera hur datan ser ut, det är då lämpligt att använda sig av “Elbow method”. Metoden fungerar genom att ett antal utföranden av en klustringsmetod genomförs med olika antal kluster som indata, sedan beräknas en förlust för varje utförande. En graf ritas med förlusten på y-axeln och antal kluster på x-axeln där förlusten blir mindre då antalet kluster ökar. Vid ett visst antal kluster kan en skarp kant noteras, en “armbåge”, och efter det så planar förlusten ut.

Värdet på x-axeln som ger den skarpa kanten är ett lämpligt val av antal kluster. Figur 4

visar hur en sådan graf kan se ut, i detta fall bildas en tydligt kant på k = 2 noteras. Det

betyderatt det skulle vara lämpligt att dela in datan i två kluster. “Elbow method” ger

inte alltid ett tydligt resultat men det är ändå en bra metod då det kan medföra en inblick

i valet av antal kluster.

(14)

Figur 4: Exempel på hur the elbow method visualiserar ett lämpligt antal kluster.

5 Metod

Som nämnt tidigare i rapporten är projektet uppdelat i två delar, metoderna för båda delarna utfördes genom att programmera en kod som uträttade den önskade arbetsupp- giften. Det här kapitlet kommer att förklara hur dataunderlaget för projektet ser ut samt hur det behövdes bearbetas för att kunna användas. En kort presentation av vilka verk- tyg som användes för utförandet kommer ges. I kapitlet kommer även koden för de båda delarna att förklaras översiktligt.

5.1 Data

Dataunderlaget som analyseras i projektet kommer i två separata delar. Den första delen

av dataunderlaget innehåller energiförbrukning angivet i kWh för varje timme hos 8515

kunder under åren 2018 och 2019. När mätdata är strukturerad på detta vis kallas de

för tidsserier. En tidserie består av datapunkter jämt fördelade i tidsordning över en viss

tidsperiod. Tidsserierna kan i detta projekt översättas till lastkurvor där varje enskild

lastkurva beskriver förbrukningsbeteendet hos varje enskild kund över de två år som det

finns mätdata för i underlaget. Sammantaget består den mätdata som ska analyseras av

totalt 8515 tidserier, där en komplett tidserie ska bestå av 17520 datapunkter, lika många

(15)

datapunkter som antalet timmar det går på två år. I och med att intresset är att generera en lastkurva för ett år och inte två beräknas ett medelvärde av datan för de två åren.

Medelvärdet används för att representera den årliga förbrukningen.

Den andra delen av dataunderlaget innehåller information om de kunder vars förbruk- ningsdata finns i datafilen som beskrivs i stycket ovan. Informationen består av attribut som kunderna kan kategoriseras enligt och hur kunderna har kategoriserats i varje attri- but kan visualiseras i tabell 2 nedan. attributen består av följande:

• 2.1.1 SCB-kod

• 2.1.2 Säkringsklass

• 2.1.3 Förbrukningsplats

• 2.1.4 Kund-ID

Elnätskunderna som befinner sig i datafilerna har anonymiserats och har var och en till- delats ett slumpmässigt valt ID-nummer. Genom ID-numret kan data från de två separata filerna kopplas till varandra.

För att generera tillförlitliga beteendemönster och kluster, bearbetas och rensas data från brister. Exempelvis saknar ett fåtal kunder komplett mätdata för tidsperioden och ett fåtal andra kunder saknar väsentlig information i filen där kundens attribut kategoriseras.

Kunder som enbart har ID-nummer i en av datafilerna tas även bort då de antingen inte

kan analyseras eller att ingen lastkurva kan konstrueras. När bearbetning och rensning

av data har utförts återstår 8251 kunder.

(16)

Antal kunder: 8251

Förbrukningsplats: SH ÖVR LGHM JORDB FH GBL

4444 1614 1238 858 35 26

MAST IND HAVH FAST AVKOPP

21 7 6 1 1

Kund-ID: P N

7176 1075

SCB: T500 T100 T200 T110 TALLM T400

1571 1289 1217 1202 873 858

T120 T132 T510 T300 T130 T133

701 386 43 35 34 25

T720 T600 T210 T721

6 6 4 1

Säkringsklass: 16 20 25 35 50 63

4774 2318 748 216 105 90

Tabell 2: Information över vad de 8251 kunderna är uppdelade i för kategorier.

Innan de timvärden från mätarna för kunder med Säkringsstorlek 16-63 A kan användas för att hitta lastprofiler för olika kundgrupper måste lastkurvorna först skalas. För att dessa typkurvor ska kunna användas i en prognosmodell måste typkurvorna skalas på ett sätt som gör att effekt och energianvändning hos en potentiell ny kund kan realiseras.

Respektive kunds förbrukning skalas mot den abonnerade effekten där den abonnerade effekten går att utläsa från kundens specifika säkringsklass. De lastprofiler som tas fram visar nu vilken förväntad andel av installerad som en kund kommer att förbruka under året. En potentiell ny kunds förväntade förbrukningsmönster kopplas till en lastprofil med liknande karaktäristik. Den nya kundens påverkan på det befintliga elnätet kan då realiseras genom att multiplicera lastprofilen som kunden kopplas till med effekten som kunden önskas abonnera.

5.2 Verktyg

Projektet utfördes genom programmering i språket Python 3.8 med hjälp av program-

biblioteken pandas, scikit-learn, matplotlib och NumPy.

(17)

5.3 Del 1

I den första delen av projektet ska lastkurvor för kunder med gemensamma SCB-koder och säkringsklasser konstrueras. Det ska konstrueras två olika typer av lastkurvor, en som visar årsförbrukning och en som visar veckoförbrukning. Koden som utför detta arbete genererar lastkurvor för en av dessa två sorteringsmetoder. Användaren väljer i koden vilken metod som ska köras. Huvuddelen av koden fungerar på samma sätt oavsett valet av användaren, så ta som exempel att koden utförs med avseende på SCB-kod.

Då valet av SCB-kod är gjort går koden in i en loop, det vill säga att den kommer att genomföra samma operationer för varje SCB-kod. Först genererar koden lastkurvor för veckoförbrukning. Målet är att kurvan ska representera ett medelvärde av alla veckor för hela året. För att genomföra det beräknas för varje ID-nummer ett medelvärde för varje veckodag. Medelvärdet för varje kund skalas från 0 till 1 för att göra lastkurvorna lättare att tyda. I och med att datan redan är skalad mot installerad effekt och nu skalas igen leder det till att y-axeln på lastkurvan blir enhetslös. Lastkurvans funktion blir därmed enbart att visualisera beteendemönster. Median och standardavvikelse mellan de olika kunderna beräknas och en graf ritas med median och medianen ±standardavvikelsen mot dagar, lastkurvan är därmed konstruerad.

För att utforma en lastkurva för hela året måste mätdata först behandlas. Ifall en lastkur- va konstrueras för ett år med mätdata för varje timme så kommer kurvan att bli väldigt ojämn då elkonsumtionen blir så pass låg på natten. För att göra lastkurvan lättare att tyda jämnas datan för varje kund ut genom att ett viktat medelvärde beräknas för var femte timme. Det medför att för varje intervall på fem timmarna blir skillnaden mellan datapunkternas position mindre vilket leder till en jämnare kurva. Lastkurvan för året konstrueras med median och standardavvikelse på samma sätt som för veckoförbruk- ningen. För att göra lastkurvan mer trivial för avläsning delas den in i kvartal.

5.4 Del 2

I den andra delen ska nya lastkurvor för veckoförbrukning och årsförbrukning konstrue-

ras genom att använda en klustringmetod. För det här projektet används metoden K-

means, för mer information hur metoden fungerar se avsnitt 4.2.1. Som nämnt tidigare

i rapporten är K-means en metod som behöver antalet kluster som indata. “Elbow met-

hod” användes för att avgöra ett lämpligt antal kluster, se Figur 5. Metoden utförs med

3 kluster i detta projekt.

(18)

Figur 5: Resultat av the elbow method.

Koden som utför arbetet börjar med att skala energidatan från 0 till 1 för att underlätta klustringen. K-means får antal kluster och den skalade energidatan som indata. Utdatan blir en vektor som är lika lång som antalet ID-nummer i dataunderlaget, där varje element är en siffra mellan 1 till 3. Varje element motsvarar en kund där siffran är vilket kluster som kunden är placerad i. Med denna information kan den stora datan bli indelad i mindre grupper och klustringen är verkställd.

När metoden har bildat kluster konstrueras lastkurvor på samma sätt som i del 1. Istället för att använda grupper med olika SCB-koder som indata i den ovannämnda loopen används de kluster som genereras av K-means. Koden ger även information om de ID- nummer som finns i varje kluster, varpå en analys genomförs med avsikt att avgöra om en slutsats kan dras om hur en viss typ av kund förbrukar el.

6 Resultat

I detta avsnitt presenteras projektets resultat. Resultaten från del 1 och del 2 återfinns i avsnitt 6.1 respektive 6.2.

6.1 Del 1

Nedan i Figur 6 och Figur 7 presenteras lastkurvor för kunder med en specifik SCB-kod

respektive säkringsstorlek. Eftersom det finns många SCB-koder och säkringsstorlekar

(19)

visas enbart två lastkurvor från varje grupp. Lastkurvorna är uppdelade i två delar. Den översta kurvan visar årsförbrukning där kurvan börjar första dagen i januari och slutar sista dagen i december. Det grafen visar är andelen effekt per den totala installerade effekten. Den nedre kurvan visar veckoförbrukning, där grafen är uppdelad i dagar. Varje dag är även uppdelad i fyra sektioner vilket visualiseras av fyra segment av olika färg, där varje segment motsvarar 6 timmar. Denna uppdelning är till för att lättare analysera kunders beteende. Y-axeln i denna graf är enhetslös på grund av att grafen enbart är till för att visa beteendemönstret för en vecka. Kurvan visar alltså när konsumtionen är hög och när den är låg men inte hur mycket som konsumeras. För både den övre och nedre kurvan är linjen med stark färg klustrets median och den tonade färgen runt om är median ± standardavvikelse.

(a) SCB-kod T100, Antal ID = 1289.

(b) SCB-kod T200, Antal ID = 1217.

Figur 6: Kluster utefter SCB-kod.

(20)

(a) Säkringsstorlek 16 A, Antal ID = 4774.

(b) Säkringsstorlek 50 A, Antal ID = 105.

Figur 7: Kluster utefter säkringsstorlek.

6.2 Del 2

Figur 8–10 visar lastkurvor för de tre kluster som generertats i del två av projektet. Ut- seende av kurvorna är detsamma som de presenterade i avsnitt 6.1 Djupare analys vad som kan läsas ut från lastkurvorna i denna del tas upp i avsnitt 7.2–7.4.

I Tabell 3 illustreras fördelningen av SCB-koder inuti kluster 1, 2 och 3. Varje kolumn

(21)

beskriver antalet kunder med en viss SCB-kod inom ett kluster och inom parantes är andelen av den totala mängden kunder med samma SCB-kod.

I Tabell 4 beskrivs fördelningen av säkringsklasser i varje kluster, och i Tabell 5 och 6 beskrivs förbrukningsställetyp respektive kund-ID.

Figur 8: Kluster 1, Antal ID = 1202.

Figur 9: Kluster 2, Antal ID = 3618.

(22)

Figur 10: Kluster 3, Antal ID = 3431.

SCB-kod

T100 T110 T120 T130 T132 T133

Kluster 1 162 (13%) 257 (21%) 116 (17%) 8 (24%) 87 (23%) 10 (40%) Kluster 2 466 (36%) 186 (15%) 146 (21%) 3 (9%) 37 (10%)

Kluster 3 661 (51%) 759 (63%) 439 (63%) 23 (68%) 262 (68%) 15 (60%)

T200 T210 T300 T400 T500 T510

Kluster 1 3 (25%) 1 (25%) 1 (3%) 160 (19%) 267 (17%) 9 (21%) Kluster 2 1203 (99%) 2 (50%) 26 (74%) 302 (35%) 895 (57%) 19 (44%)

Kluster 3 11 (1%) 1 (25%) 8 (23%) 396 (46%) 409 (26%) 15 (35%)

T600 T720 T721 TALLM

Kluster 1 2 (33%) 2 (33%) 1 (100%) 116 (13%) Kluster 2 3 (50%) 2 (33%) 328 (38%) Kluster 3 1 (17%) 2 (33%) 429 (49%)

Tabell 3: Klusterinnehåll med avseende på SCB-kod.

(23)

Säkringsklass

16 A 20 A 25 A 35 A 50 A 63 A

Kluster 1 391 (8%) 393 (17%) 258 (35%) 81 (38%) 42 (40%) 37 (41%) Kluster 2 2874 (60%) 511 (22%) 145 (19%) 48 (22%) 21 (18%) 19 (23%)

Kluster 3 1509 (32%) 1414 (61%) 345 (46%) 87 (40%) 44 (42%) 32 (36%) Tabell 4: Klusterinnehåll med avseende på säkringsklass.

Förbrukningsställetyp

AVKOPP FAST FH GBL HAHV JORDB

Kluster 1 1 (100%) 1 (3%) 3 (12%) 2 (33%) 160 (19%)

Kluster 2 26 (74%) 14 (54%) 3 (50%) 302 (35%)

Kluster 3 1 (100%) 8 (23%) 9 (35%) 1 (17%) 396 (46%)

LGHM MAST SH ÖVR IND

Kluster 1 4 (0.3%) 1 (5%) 751 (17%) 276 (17%) 3 (43%) Kluster 2 1223 (99%) 5 (24%) 1129 (25%) 914 (57%) 2 (29%)

Kluster 3 11 (0.7%) 15 (71%) 2564 (58%) 424 (26%) 2 (29%) Tabell 5: Klusterinnehåll med avseende på förbrukningsställetyp.

KUND-ID

P N

Kluster 1 943 (13%) 259 (24%) Kluster 2 3115 (43%) 503 (47%) Kluster 3 3118 (43%) 313 (29%)

Tabell 6: Klusterinnehåll med avseende på kund-ID.

(24)

7 Diskussion

7.1 Utvärdering av E.ONs nuvarande metod

Figurerna 6 och 7 visar exempel på lastkurvor för E.ONs nuvarande kategoriseringsme- tod. För säkringsklasser finns i den här datan ytterligare 4 lastkurvor och för SCB-koder ytterligare 14 lastkurvor. Det som är positivt med den här metoden är att kurvorna är lättlästa och det går att se beteendemönster. Många lastkurvor har dock väldigt lika be- teendemönster och ser mer eller mindre identiska ut. En svaghet med metoden är att det en relativt stor spridning i mängden förbrukning vilket visas i en stor standardavvikelse.

I och med att kunderna blir uppdelad i så pass många grupper kan en anse att osäkerhe- ten bör vara mindre. Det blir otympligt att dela in kunder i så pass många grupper, där många av kurvorna är liknande samt spridningen ändå är stor. Det kan även uppkomma problem ifall till exempel ett nytt kontrakt ska skrivas med en potentiell kund vars SCB- kod T200 och säkringsstorlek 16.0 A. Det blir då svårt för E.ON att förutse hur den kunden kommer att bete sig i och med att lastkurvan för SCB-kod T200 är förhållande- vis olik kurvan för säkringsstorlek 16.0 A, se Figur 6b och 7a. Innan kapacitetsbristen uppstod var den här metoden tillräckligt bra i och med att det gav en bild av konsum- tionsmönster, men i och med den rådande situationen behöver E.ON en ny metod där lastkurvorna har mindre spridning samt innehåller mer information om kunderna. Det kan leda till förbättrade framtidprognoser och att all el som är tillgänglig kommer ut till konsumenten.

7.2 Analys av kluster 1

Kluster 1 innehåller 1202 ID-nummer och lastkurvan ses i Figur 8. Genom att stude-

ra lastkurvan för årsförbrukning blir det tydligt att konsumtionen av el är väldigt hög

under de kvartal det är vinter och sedan blir markant lägre under sommaren. En sådan

lastkurva är typisk för en fastighet där det som varierar elkonsumtion mest är utomhus-

temperatur samt antal ljustimmar. Lastkurvan för veckoförbrukning visar att det är låg

konsumtion på natten, får en liten topp på morgonen, blir sedan låg under dagen och

sedan en stor topp på kvällen. Det här mönstret tyder på att lastkurvan primärt represen-

terar bostäder, där folk jobbar eller går i skolan på dagen och är hemma på morgonen

och kvällen. Antagandet stärks genom att även studera konsumtionsbeteendet på lörda-

gar där förbrukningen inte blir lika låg mitt på dagen som den blev på vardagar. Dock är

konsumtionen på söndagar väldigt lik konsumtionen på vardagar vilket är något oväntat

i och med att den förväntades se ut som förbrukningen för en lördag. Det skulle kunna

(25)

förklaras genom att det är möjligt att det finns fler kunder än bara bostäder i klustret vilket gör att lastkurvan ser ut på detta sätt.

I kluster 1 är det många SCB-koder som har en låg andel av den totala mängden med samma kod. SCB-kod T721 har 100% av sina kunder i klustret dock är det enbart en kund. SCB-kod T133 har 10 kunder i det här klustret vilket är 40% av de totala antal kunder med samma kod, vilket också är ett relativt lågt antal kunder.

Säkringsstorleken säger mer om det här klustret än vad SCB-koder gör. Till antalet är det flest kunder med säkringsstorlek 16.0 A och 20.0 A, dock är andelen enbart 8%

respektive 17%. Det är tydligt att det här klustret är för kunder med större fastigheter då andelen av kunder ökar med ökad säkringsstorlek. Andelen hos de ID-nummer med säkringsstorlekar 25.0 A, 35.0 A, 50.0 A och 63.0 A i klustret ligger mellan 35–41%, se tabell 4 för mer detalj.

I det här klustret är utseendet för innehållet angående förbrukningsplats tämligen likt det för SCB-kod. Många fastighetstyper har låg andel och de som har högt är få i antal.

Mängdmässigt dominerar småhus, vilket det finns 751 av, det är dock enbart 17% av alla småhus i datan. 100% av AVKOPP finns i det här klustret, men likt SCB-kod T721 är det enbart en kund. Fastigheter som är klassade som industrier har 43% av sina kunder i kluster 1, men består endast av 3 kunder i klustret.

Det är svårt att dra någon slutsats angående det här klustret baserat på enbart SCB-kod då det inte finns något tydligt mönster. Att det är 100% av SCB-kod T721 samt av fas- tigheter som är klassade AVKOPP säger inget då det enbart finns en kund, det är omöjligt att veta om andra kunder med samma klassificeringar kommer att bli placerade i det här klustret. Det är även svårt att dra en slutsats om kunder med SCB-kod T133 och kunder med industrier som attribut, då antalet av dessa kunder i klustret är få samt att andelen inte är en majoritet. En möjligt slutsats kan vara att det här klustret är för stora småhus.

Fastän andelen småhus är relativt låg så de till antal en klar majoritet av detta kluster.

Det är möjligt att de 17% småhus i det här klustret skiljer sig från resterande småhus. Ett

rimligt antagande är att dessa hus är större och därmed har högre elkonsumtion. Fördel-

ningen av säkringsstorlekar styrker antagandet. Det är större sannolikhet att en fastighet

med stor säkringsstorlek kommer bli placerad i kluster 1 än en fastighet med låg. Denna

fördelning kan även styrka att fastigheter med klassen industrier bör bli placerad i det

här klustret, då de generellt konsumerar mycket el. Angående KUND-ID så är det större

sannolikhet att en näringsidkare skulle bli placerad i klustret än en privatperson, i

och med att andelen för näringsidkare är större än den för privatpersoner, 24% mot

13%.

(26)

7.3 Analys av kluster 2

Kluster 2 innehåller 3618 ID-nummer och lastkurvan ses i Figur 9. Kurvan för årsför- brukning har liknande mönster som den för kluster 1. Vad som skiljer kluster två åt är att skillnaden från högsta till lägsta konsumtion inte är lika stor. Det tyder på att fastig- heterna för det här klustret inte behöver förbruka lika mycket el för uppvärmning som det tidigare nämnda klustret. Veckoförbrukningen är något mer svårtolkad. Vid första anblick ser det ut som att konsumtionen börjar öka på morgonen och sedan fortsätter den att öka tills sent på kvällen. Studerar man dock veckodagarna mer noggrant ser man att mitt på dagen bildas en platå, vilket tyder på att en del av kunderna i det här klustret är bostäder. Varför det blir en platå och att förbrukningen inte går ner kan bero på att det finns ID-nummer i klustret som inte är bostäder som fortsätter att konsumera el mitt på dagen.

SCB-kod T200 har 1203 kunder i kluster 2 och en mycket stor andel med nästan 99%

av alla kunder med den koden befinner sig i det här klustret. Det finns även många ID- nummer med SCB-kod T500 där antalet är 895 kunder, vilket motsvarar en andel på 57%. Drygt 74% av alla ID-nummer med SCB-kod T300 ingår i klustret med 26 kunder.

50% av ID-nummer med SCB-kod T210 befinner sig i detta kluster. Det är dock svårt att göra en analys då det enbart är 2 kunder. Samma sak kan sägas om SCB-kod T600 som också har 50% av sina kunder i kluster 2 men det utgörs av 3 kunder. Drygt 44%

av alla kunder med SCB-kod T510 befinner sig i klustret, vilket är 19 kunder. Klustret innehåller också en relativt stor mängd ID-nummer med SCB-kod TALLM, T100 och T400 där andelen ligger mellan 35–38%, se tabell 3 för mer detalj.

I kluster 2 dominerar ID-nummer med säkringsstorlek 16.0 A med 2874 kunder vil- ket motsvara 60% av alla kunder med samma säkringsstorlek. Genom att enbart studera antal så finns det även relativt många kunder med säkringsstorlek 20.0 A, dock är an- delen tämligen lika de andra säkringsklasserna, 25.0 A, 35.0 A, 50.0 A och 63.0 A.

Andelen kunder för dessa 5 säkringsstorlekar är ungefär 18–23%, för mer detalj se tabell 4.

Det finns 1223 lägenheter i det här klustret, vilket nästan är 99% av alla lägenheter som finns i datan. Knappt 57% av alla fastigheter som är klassade övrigt ingår i klustret vilket motsvarar 914 kunder. Det är 1129 småhus i klustret vilket är ett förhållandevist stort antal, det är dock svårt att avgöra om de hör hemma i det här klustret då det enbart utgör 25% av alla småhus. Drygt 74% av alla fritidshus är i kluster 2 med 26 ID- nummer. Gatubelysning och HAHV har båda en relativ stor andel i klustret, 50-54%, trots det är det svårt att dra någon slutssats då det enbart är 14 respektive 3 kunder. 35%

av alla jordbruk blir placerade i det här klustret med 302 kunder.

(27)

Det är tydligt att det här klustret är ett lägenhets-kluster, en ny kund som bor i en lägenhet med SCB-kod T200 skulle med mycket stor sannolikhet höra till det här klust- ret. Lastkurvans utseende för årsbrukning tyder även på att det här klustret representerar lägenheter då elkonsumtionen är relativt låg och jämn över hela året. Även en fastighet som är klassad övrigt med SCB-kod T500 skulle ha en möjlighet att bli placerad i klust- ret. En kund med SCB-kod T300 skulle antagligen också bli tilldelad det här klustret, samma sak kan antas om fritidshus. Kunder med SCB-kod T510 är svåra att analyse- ra i och med att det är en relativ stor andel kunder med i klustret men det är så få kunder med i den totala datan att det blir svårt att dra någon slutsats. Resterande SCB-koder är antingen för låga i antal eller andel för att kunna göra en klar analys. Samma sak kan sägas om jordbruk, gatubelysning, småhus och HAHV. Angående säkringsstorlek så kan det antas att en kund med storlek 16.0 A kommer bli placerad i det här klustret, möj- ligheten skulle bli ännu större om det parades ihop med någon av de nämnda SCB-koder eller förbrukningsplater som är karaktäristiska för klustret. Resterande säkringsstorlekar är för lika samt har för låg andel kunder i klustret för att det ska kunna dras en slutsats om någon av de generellt bör bli placerade i kluster 2. I klustret är det tämligen jämt fördelat mellan näringsidkare och privatpersoner som har andelen 47% respektive 43%.

7.4 Analys av kluster 3

Kluster 3 innehåller 3431 ID-nummer och lastkurvar ses i Figur 10. Lastkurvan för klus- ter 3 är väldigt lik den för kluster 1, både för årsförbrukning samt för veckoförbrukning.

Det som skiljer dem åt är att kluster 3 har något lägre elkonsumtion annars kan sam- ma antagande som är gjordes för lastkurvan för kluster 1 göras angående lastkruvan för kluster 3.

I kluster 3 finns det flera SCB-koder som har en relativt stort andel kunder. SCB-kod T110, T120 och T132 har en alla en andel mellan 63–68%. Det är även förhållandevis många kunder som har dessa tre koder i klustret, se tabell 3. Det är även en hög andel av SCB-kod T130 och T133, 68% respektive 60%, dock är antalet kunder betydligt färre än de tre koder nämnda ovan. Det finns ytterligare tre koder med högt antal men inte lika hög andel. Dessa koder är SCB-kod T400, TALLM och T100 och de har en andel mellan 46–51%. Det finns ytterligare 5 koder med andel mellan 20–35% men de anses antingen vara för låga i antal eller att andelen är för låg för att vidare diskuteras i analysen.

Säkringsstorlek 16.0 A har flest kunder i klustret med 1509 ID-nummer, dock har de

lägst andel av alla säkringsstorleker. Den säkringen som ger ett tydligast mönster är

säkringsstorlek 20.0 A med 1414 kunder vilket motsvarar en andel på 61%. Andelen

hos säkringsstorlek 25.0 A, 35.0 A och 50.0 A är som högst i kluster 3 och ligger

(28)

mellan 40–46%. Det är en relativt stor andel av säkringstorlek 63.0 A med knappt 36%, dock finns det en större andel av denna säkringsstorlek i kluster 1.

Kluster 3 har ett stort antal småhus med 2564 kunder vilket motsvarar en andel på knappt 58%. Det finns även en förhållandevis stor andel av jordbruk som är drygt 46%, vilket är 396 ID-nummer. Både telemaster och flerbostadhus har en väldigt stor andel i klustret dock i och med att det är ett lågt antal kunder med dessa förbrukningsplatsklasser är det svårt att göra vidare analys, se tabell 5. Fastigheter som är klassade övrigt har 424 kunder vilket är den andra vanligaste fastighet i klustret men andelen är enbart 26%.

Det är en klar majoritet småhus i det här klustret med 2564 av 3431 ID-nummer, samt är

andelen av alla småhus högre än de andra två klustren kombinerad. Det finns ett flertal

SCB-koder som kan bli placerade i klustret. Fem av dem har en andel på över 60%, vilket

är signifikant mycket större än andelen i de två andra klustren. SCB-kod T400, TALLM

och T100 är svårare att med full säkerhet placera i det här klustret. Andelen ligger på

ungefär 50%, dock är den andelen inte mycket större än den i kluster 2 där den är mellan

35–38%. Var dessa SCB-koder kommer placeras kommer bero på vad de kombineras

med för säkringsstorlek samt förbrukningsplats. Säkerhetsstorlek 20.0 A har den tyd-

ligaste platsen i det här klustret med ett högt antal och hög andel. Det är intressant att

jämföra det här klustret med kluster 1, som båda domineras av småhus till antal. Last-

kurvorna för de båda klustrena har liknande form där skillnaden är att årsförbrukningen

för kluster 1 är något högre. Det är intressant att studera andelen av de två lägsta säker-

hetsstorlekarna i båda klustren. I kluster 1 är andelen kunder med säkerhetsstorlek 16.0

A och 20.0 A enbart 8% respektive 17% medan i kluster 3 är andelen 32% respektive

61%. Det är en signifikant ökning vilket vidare styrker det tidigare antagandet att klus-

ter 1 innehåller större småhus. Det antagandet kan vidare byggas på genom att säga att

kluster 3 antagligen representerar de resterande småhusens elkonsumtion. Det som kan

försvaga antagandet är att i kluster 3 likt kluster 1 är andelen av de högre säkringsstor-

lekarna relativt höga. Dessa säkringsstorlekar kan dock bero på det förhållandevis höga

antalet jordbruk som har sin högsta andel i det här klustret. Angående KUND-ID så

är fördelningen av andel kunder omvänd från kluster 1 där privatpersoner har drygt

43% av sina kunder i klustret medan näringsidkare har 24%.

(29)

8 Slutsatser

Två av målen som togs upp i början av rapporten kan ses vara uppfyllda i och med att lastprofiler för olika kunder utifrån SCB-koder och säkringsstorlekar har presenteras samt att egna kluster har konstruerats. De egna klustrens lastkurvor samt innehåll har analyserats, dock är frågan om det är en bättre sorteringsmetod än E.ONs nuvarande obesvarad. Genom att studera lastkurvorna är det svårt att säga att den ena metoden är bättre än den andra eftersom kurvorna är relativt lika samt att spridningen i form av standardavvikelse är ungefär samma. Efter analys har det dock visat sig att det finns mönster inom klustrena som är framtagna via K-means. Genom att kombinera SCB- kod, säkringsstorlek och fastighetstyp kan det vara möjligt att få en tydligare bild av hur en ny potentiell kund kommer att förbruka sin energi än att enbart gå efter kundens SCB-kod eller säkringsstorlek.

Det som skapar problem med att ta fram nya kluster för dataunderlaget i det här projektet är att vissa grupper är överrepresenterade, det kan tydligt ses i tabell 2. Av 8251 kunder är 5682 kunder antingen småhus eller lägenheter, vilket gör att en klar majoritet av al- la kunder är bostäder. Detta leder till att andra intressanta kundgrupper som till exempel jordbruk och industrier inte representeras på ett bra sätt i lastkurvorna utan istället bidrar till större standardavvikelse. Det blir även tydligt vid granskning av fördelningen av KUND-ID då 7176 kunder är klassade som privatperson. Den ojämna fördelning- en medför även problem när det kommer till att dra slutsatser om en vis typ av kund när det bara finns ett fåtal av den typen. Ytterligare ett problem med dataunderlaget är det höga antalet fastigheter som är klassade som övrigt. Eftersom de är många i antal på- verkar de lastkurvornas utseende väldigt mycket men på grund av att det inte finns någon information vad det är för typ av kund blir det omöjligt att utföra en analys. Genom att ha ett dataunderlag där det är mer jämt fördelat mellan de olika kategorierna samt mer information om kunderna är det möjligt att flera distinkta lastprofiler kan konstrueras och en djupare analys kan genomföras.

Det kan inte dras en slutsats i nuläget om den nya klustringmetoden är en bättre sorte- ringsmetod för E.ON än deras nuvarande. Metoden anses dock vara ett steg i rätt rikning då intressanta mönster inom klustren har noterats. Det som behöver utvecklas för att me- toden ska bli bättre är bland annat att rensa dataunderlaget ytterligare. I underlaget finns det så kallade “outliers”, vilket är mätvärden som skiljer väldigt mycket från resterande data. Kunder med många outliers bör tas bort eftersom deras oregelbunda beteende inte representerar hur en kund konsumerar el vilket leder till större spridning inom kluster.

I det här projektet utfördes även klustring med andra metoder än K-means, dock gav

de metoderna väldigt lika resultat och i vissa fall sämre resultat. Det finns många olika

(30)

typer av klustringsmetoder. För att förbättra resultatet är det också viktigt att undersöka

och prova nya metoder.

(31)

Referenser

[1] Kapacitetsbrist i elnätet | Vi förklarar - E.ON. URL: https://www.eon.se/om- e-on/kapacitetsbristen (hämtad 2020-04-29).

[2] Standard för svensk näringsgrensindelning (SNI). sv. URL: http://www.scb.

se/dokumentation/klassifikationer-och-standarder/standard-for- svensk-naringsgrensindelning-sni/ (hämtad 2020-04-27).

[3] Välj rätt huvudsäkring - Vattenfall Eldistribution. URL: https : / / www . vattenfalleldistribution . se / el - hem - till - dig / valj - ratt - huvudsakring/ (hämtad 2020-04-29).

[4] David Arthur och Sergei Vassilvitskii. ”k-means++, The Advantages of Careful Seeding”. Diss. URL: https : / / theory . stanford . edu / ~sergei / papers / kMeansPP-soda.pdf (hämtad 2020-05-04).

[5] Maria Ester m. fl. ”A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise”. Diss. URL: https://www.aaai.org/Papers/

KDD/1996/KDD96-037.pdf (hämtad 2020-05-02).

References

Related documents

Cannon och Witherspoon (2005) sammanfattar fem typiska fallgropar vid levererandet av feedback som kan leda till att informationen inte uppfattas på rätt sätt av mottagaren i

De tolkningar som vi skall ta till oss när vi tittar på utställningen presenteras genom ett av verken ”...som varken väjer för tankens djup eller hantverkets precision.”

En staccatoartad prosodi är bland annat kännetecknande för förortsslangen, och då uttalsdragen inte kan kopplas till något specifikt förstaspråk betraktas inte detta sätt att

I denna studie så togs samtyckeskravet till hänsyn genom att individen själva bestämma över sitt deltagande i studien och under vilka premisser deltagandet skulle

Pre- cis som Brändström och Wiklund (1995), lyfter Kokotsaki fram hur pianisten har ett instru- ment som är skapat på ett sätt att som ger möjlighet att både spela harmonier

Trots att vi i våra efterföljande samtal fick svaret från nästan alla observerade lärare att det är viktigt att eleverna får höra både de matematiska

Jag färgar mina varpflätor och inslagsgarn innan jag sätter upp väven för att få fram färg som jag vill arbeta med genom hela varpen och med inslag?. Men också för att få en

Eftersom FUB riktas till arbetssökande med en relativt, jämfört med andra arbetssökande, svag förankring på arbetsmarknaden skulle deltagande i insatsen