Tillämpning av maskininlärning för att införa automatisk adaptiv uppvärmning genom en studie på KTH Live-In Labs lägenheter

(1)

GRUNDNIVÅ, 15 HP ,

STOCKHOLM SVERIGE 2020

Tillämpning av maskininlärning för

att införa automatisk adaptiv

uppvärmning genom en studie på

KTH Live-In Labs lägenheter

EMIL VIK OCH INGRID ÅSENIUS

KTH

(2)

Abstract— The purpose of this study is to investigate if it is

possible to decrease Sweden's energy consumption through adaptive heating that uses climate data to detect

occupancy in apartments using machine learning. The application of the study has been made using

environmental data from one of KTH Live-In Labs apartments. The data was first used to investigate the possibility to detect occupancy through machine learning and was then used as input in an adaptive heating model to investigate potential benefits on the energy consumption and costs of heating. The result of the study show that occupancy can be detected using environmental data but not with 100% accuracy. It also shows that the features that have greatest impact in detecting occupancy is light and carbon dioxide and that the best performing machine learning algorithm, for the used dataset, is the Decision Tree algorithm. The potential energy savings through adaptive heating was estimated to be up to 10,1%. In the final part of the paper, it is discussed how a value creating service can be created around adaptive heating and its possibility to reach the market.

Index Terms—Linear Regression, Support Vector

Machines, Decision Tree, Occupancy detection, energy consumption, Sweden, adaptive heating

I. BAKGRUND OCH SYFTE

örenta Nationernas medlemsländer antog år 2015 de 17 globala målen som syftar till att skapa en bättre värld samtidigt som framtida generationers levnadsstandard inte äventyras. [1] Som ett av FN:s medlemsländer har Sverige åtagit sig att sträva mot de globala målen.

Enligt rapporten Energiläget 2019 stod sektorn Bostäder och service för cirka fyrtio procent av Sveriges totala energianvändning på 378 TWh år 2017. [2] Då denna sektor står för en påtaglig del av energikonsumtionen kan

förändringar i sektorn vara en bra väg för Sverige att arbeta mot de Globala målen. Vidare går det att konstatera att cirka 55% av energiförbrukningen i sektorn bostäder och service kommer från uppvärmning och att cirka en tredjedel av den uppvärmningen sker i flerbostadshus. [2]

En minskad uppvärmning av lägenheter är svårt att uppnå genom en konstant sänkning av temperaturen i bostäder då det finns riktlinjer från Folkhälsomyndigheten som reglerar tillåten boendetemperatur.[3] Det kan däremot finnas potential att minska energikonsumtionen för uppvärmning i lägenheter

utan att kompromissa med de boendes komfort genom adaptiv uppvärmning. Adaptiv uppvärmning innebär att

inomhustemperaturen regleras beroende på om någon är hemma eller inte. Idag finns det tjänster för

temperaturreglering på marknaden men huvudsakligen möjliggörs dessa genom mänsklig interaktion. [4] Skulle det vara möjligt att införa ett automatiserat system skulle det vara att föredra då detta skulle ta bort den mänskliga faktorn och förhoppningsvis därmed optimera uppvärmningsbehovet.

För att införa automatiserade system för adaptiv uppvärmning krävs ett styrsystem. En teknologi för att möjliggöra detta är maskininlärning. Maskininlärning bygger på att studera mönster i data och på så sätt kunna dra slutsatser och ta beslut. Eftersom sensorer och insamlande av data blir allt vanligare i bostadssektorn finns det stora möjligheter att tillämpa maskininlärning för att hitta nya och bättre lösningar för smartare hem.

Skulle det vara möjligt att med befintliga insamlade data avgöra huruvida någon är hemma eller inte kan detta innebära att man på ett automatiserat sätt kan reglera temperaturen i bostäder utan att installera närvarosensorer. Detta vore fördelaktigt då en specifik närvarosensor innebär ökade kostnader i form av installation av sensorn samt kostnader för lagring och hantering av ökade mängder data. [5] Studier för detektering av närvaro med klimatdata genom maskininlärning har utförts tidigare. En av dessa är ett arbete av Luis M. Candanedo och Véronique Feldheim med klimatdata från ett kontor som ligger tillgänglig för andra att använda på UCI:s hemsida. Studien visar att de med det datasetet lyckas göra nästan helt korrekt närvarodetektering med enbart de enklaste övervakade maskininlärningsmetoderna. [6],[9]

Det här kandidatexamensarbetet syftar till att undersöka om lika bra närvarodetektering går att genomföra på klimatdata från KTH Live-In Labs lägenheter och om det sedan kan användas till att skapa ett automatiserat system för adaptiv uppvärmning av en lägenhet och om det kan leda till ett minskat uppvärmningsbehov samt kostnadsbesparingar.

II. VETENSKAPLIG FRÅGA

Frågan som ska besvaras och undersökas i detta

kandidatexamensarbete är Vilka effekter på energiförbrukning kan uppnås genom att införa adaptiv uppvärmning i

lägenheter genom närvarodetektering på klimatdata? Denna fråga bryts ner i följande delfrågor:

E. Vik, Kungliga Tekniska Högskolan, I. Åsenius, Kungliga Tekniska Högskolan

Tillämpning av maskininlärning för att införa

automatisk adaptiv uppvärmning genom en

studie på KTH Live-In Labs lägenheter

(3)

- Vilken maskinlärningsmodell är mest lämplig för att detektera närvaro med klimatdata?

- Vilken klimatdata är mest lämplig att använda som indata i den valda maskininlärningsmodellen? - Leder närvarodetekteringen till att behovet av

uppvärmning i lägenheter kan minskas? Om ja, hur stor är den ekonomiska nyttan?

III. TIDIGARE STUDIER

Som nämnt i introduktionen har det utförts ett flertal studier tidigare med syfte att undersöka närvarodetektering med olika metoder, och möjligheterna med detta för främst bättre reglering av värme, ventilation och luftkonditionering och på så sätt minska energiförbrukningen.

En studie utförd av Nanyang Technological University i Singapore [7] belyser specifikt det ökade intresset att lyckas estimera närvaro inomhus med klimatdata för att uppnå energibesparingar. Anledningen till varför detta anses fördelaktigt jämfört med de metoder som används idag för att detektera närvaro med kamera eller

mönsterigenkänningstekniker är att dessa metoder anses svåra att implementera storskaligt på grund av kostnader för tekniken samt integritetsproblem. Det studien kommer fram till är att en metod som använder sig av koldioxidhalt är den mest lämpliga för att estimera närvaro men att

implementeringen inte heller alltid är helt enkelt. Anledningen till varför koldioxid anses vara den bästa parametern i denna studie är att det är den klimatdata som korrelerar bäst med närvaro och att en metod som regleras med koldioxidhalt möjliggör att inte bara veta om någon är hemma utan också hur många som är hemma. Med inomhus klimatdata menas bland annat ljus, ljud, luftfuktighet och temperatur.

De ser också en fördel i att många lägenheter med

luftkonditionering och ventilation redan har koldioxidmätare. Svårigheter de ser med att enbart använda koldioxidhalt för att estimera närvaro är att halten beror på faktorer så som öppning och stängning av dörrar och fönster samt att

närvarodetekteringen blir bättre om man behandlar datan i förväg vilket kan försvåra implementering i realtid. [7]

I en studie utförd i Danmark tar man upp dessa svårigheter med helt korrekt insamling av klimatdata och jämför ett testrum med optimala förhållanden och en lägenhet med 3 rum. I lägenheten med 3 tum kunde sensorerna påverkas av yttrefaktorer så som ljusinsläpp från fönster samt att sensorerna var placerad i ett av rummen men att det fanns andra utrymmen i lägenheten där personen kunde befinna sig och därmed påverkade registreringarna. Skillnaden i

korrekthet blev hela 20%. [8]

Luis M. Candanedo och Véronique Feldheim, som använder historiska data, det dataset som finns tillgängligt på UCI, och fokuserar på jämförelse av algoritmer och val av features kommer fram till att valet av algoritm och features har stor inverkan på korrektheten i närvarodetektering. Utifrån de algoritmer som studien undersöker kommer de fram till att de mest fördelaktiga, med korrekthet mellan 95% och 99%, är: Linear Discriminant Analysis (LDA), vilket är en

sannolikhetsbaserad algoritm likt Logistic Regression, CART-modeller vilket Decision Trees är ett exempel på samt

Random Forest vilket är flera olika Decision Trees

kombinerat. Implementeringen av modellerna utfördes med open source programmet R där ovannämnda algoritmer finns tillgängliga. Djupare förklaring av dessa algoritmer och dess implementering i R går att finna i följande litteratur ([9]).

I studien, gällande features, kommer de fram till att två features räcker för hög korrekthet och att ljusstyrkan är inkluderad i de kombinationer som ger bäst resultat. Valet av features kommer de fram till beror dock mycket på vilken algoritm man bygger modellerna med. Detta gör valet av features och algoritm till en viktig aspekt att ta hänsyn till när man vill implementera närvarodetektering liksom att det är av stor vikt att ha noga insamlade och hanterade data vilket studien ovan också visade. Logistic Regression testades i studien men algoritmen lyckades inte få modellen att konvergera vilket de hänvisar till att featuresen var väldigt separerade vilket är en faktor som Logistic Regression har svårt att hantera [6].

Med samma dataset som används i ovannämnda studie utförs dock Logistic Regression med Pythons inbyggda bibliotek sklearn i en artikel publicerad i utbildningssyfte av PhD Jason Brownlee. Hans undersökning visar att det går att utföra närvarodetektering med Logistic Regression och med korrekthet på 99 %. Detta är dock med hänsyn till alla features det vill säga, luftfuktighet, temperatur, ljusstyrka, relativ luftfuktighet och koldioxidhalt. I försök med bara en feature och Logistic Regression visar Brownlees undersökning att det bara är ljusstyrka som kan detektera närvaro över baseline medan koldioxid som enligt andra studier ska vara bra för att detektera närvaro [7] presterar sämst.

Anledningen till varför ljusstyrkan har en så stor inverkan och presterar bra ger han två förklaringar till (1) att

ljussensorn registrerar när lampan är tänd och att man

tänder/släcker lampan när man går in och ut och (2) att studien utförs på ett kontor och att kontorstimmarna sammanfaller med när det är ljust på dagen.

Att resultaten med enbart en feature, förutom ljus, ger resultat under baseline är sannolikt anledningen till varför Logistic Regression algoritmen sägs inte vara tillräcklig i studien av Luis M. Candanedo och Véronique Feldheim. Jason Brown drar dock slutsatsen att en enklare modell skulle vara bättre än mer gedigna maskininlärningsalgoritmer. [10]

I en studie som enbart implementerade algoritmen Decision Tree för närvarodetektering i ett kontor och jämförde

featuresen ljus, ljud, koldioxid, rörelse och ström från användning av datorn kom fram till andra slutsatser gällande vilka features som var mest fördelaktiga. Denna kom fram till att ljus var den sämsta featuren för att detektera närvaro, att koldioxid var bättre men att rörelsesensorer var överlägset bäst. [11] Denna slutsats baseras på att alla kombinationer av de andra featuresen inte kunde uppnå samma korrekthet tillsammans som rörelsesensorn kunde uppnå själv. De menar också att Decision Trees som tränas upp med för många features kan leda till overfitting och därför sämre resultat vid implementering. Därför menar de att det skulle varit

(4)

på syftet med närvarodetekteringen. För implementeringen vid reglering av värme, ventilation och luftkonditionering är inte helt korrekt närvarodetektering lika viktig som vid

implementering av till exempel säkerhetssystem. [11] IV. TEORI

I detta avsnitt introduceras den teori som är relevant för att kunna besvara frågeställningen. Det inleds med teorin bakom maskininlärning samt närvarodetektering och övergår sedan i teori kopplat till uppvärmningsbehovet för lägenheter. I teorin förekommer flertalet begrepp på engelska som inte är

översatta. Anledningen till detta är att de engelska begreppen är mer beskrivande.

A. Maskininlärning

Maskininlärning har en lång historia och redan 1959 formulerade Arthur L. Samuels målet att datorer skulle kunna lära sig själva utan att behöva programmeras explicit. [12] Syftet och idén bakom maskininlärning är att man baserat på data kan göra förutsägelser och prognoser genom olika matematiska beräkningar och algoritmer för att hitta underliggande mönster. Maskininlärning och mönsterigenkänning ligger till grund för avancerade tillämpningar som bland annat ansiktsigenkänning, prognostisering av försäljning och nu också möjligheten att detektera närvaro med klimatdata. För att implementera maskininlärning krävs ett flertal steg och processer. Dessa processer introduceras nedan tillsammans med grundläggande förklaring av de tre olika modellerna som kommer

undersökas; Logistic Regression, Support Vector Machines och Decision Trees.

a) Data

Det första och generellt mest tidskrävande samt kritiska steget vid implementering av maskininlärning är

datainsamlingen och förberedelsen av data. Här inkluderas steg som att identifiera hur konsekvent och trovärdig datan är, undersöka avvikande värden samt granska om kritisk

information saknas för att kunna utföra estimeringen. Inom dataförberedelse för övervakad maskininlärning (se d) Övervakad/Oövervakad maskininlärning) inkluderas också att välja och undersöka vilka features som ska representera varje datapunkt och som man förväntar sig kan ha en korrelation med det man vill undersöka. Termen för det man vill undersöka inom maskininlärning kallas label och vid upplärning av en övervakad maskininlärningsmodell krävs detta för varje datapunkt.

b) Korsvalidering/Överanpassning

Datamängden brukar efter processeringen av data delas in i två olika datamängder; träningsmängden som används för att bygga upp modellen och testmängden som används för att testa modellen och se hur väl den fungerar. Ett vanligt sätt att dela upp datamängden är att använda 70% för träning och 30% för validering. [12] Detta fenomen kallas cross-validation. Struntar man i det är risken stor att man överanpassar modellen. Detta innebär att modellen blir exceptionellt bra på det datasetet som man tränar upp modellen med men att den sen inte är lika flexibel i sin

applikation på andra dataset. Detta koncept kallas bias-variance tradeoff och är ett vanligt argument för eller emot olika algoritmer och modeller för olika tillämpningsområden. Är tillgängligheten av data begränsad är en vanlig metod att upprepa försöken på samma dataset flera gånger men med olika varianter i uppdelningen av träning- och testdataset. Detta är vad som på engelska kallas k-fold cross-validation. [12]

c) Val av algoritm och features

En stor påverkan på resultatet vid maskininlärning är val av algoritm och features. Inom övervakad maskininlärning finns det ett flertal olika algoritmer som passar olika bra beroende på tillämpningsområde och förutsättningar. Att på förhand veta vilken algoritm och vilka features som ger bäst resultat är svårt. Ett vanligt tillvägagångssätt är därför att implementera flera olika metoder på samma dataset och sedan jämföra vilken som ger bäst resultat baserat på testmängden. Samma iterativa strategi är också vanlig för att avgöra vilka features och vilka kombinationer av dem som ger bäst resultat. Fler features är inte nödvändigtvis bättre vilket studien av Luis M. Candanedo och Véronique Feldheim visar.

d) Övervakad/Oövervakad maskininlärning Det finns flera olika kategoriseringar av maskininlärning. En vanlig kategorisering och differentiering mellan metoder och algoritmer är om algoritmen är övervakad eller

oövervakad. Den största skillnaden mellan dessa är att övervakad maskininlärning kräver att datapunkterna har en label vilket inte de oövervakade maskininlärningsmetoderna gör. Detta innebär att oövervakade maskininlärningsmetoder inte i förväg behöver veta hur många olika kategorier datasetet ska klassificeras till men det gör det också svårare att få resultatet lika korrekt och trovärdigt.

e) Algoritmer

Nedan följer de tre övervakade klassificerings algoritmerna som kommer att undersökas och implementeras i den här studien.

i) Logistic regression

Logistic regression är en sannolikhetsbaserad övervakad maskininlärningsmodell som används vid

klassificeringsproblem. Logistic Regression använder sig av en linjär ekvation z=Ѳ0+ Ѳ1*x1+ Ѳ2*x2+… där Ѳn

representerar vikter, xn är varje feature och z är det

förutspådda värdet. Det förutspådda värdet kan i den linjära funktionen bli vilket reellt värde som helst. [13]

För att kunna avgöra hur man ska klassificera dessa värden placerar man utfallet från den linjära funktionen i vad som kallas sigmoid funktionen ℎ = 𝑔(𝑧) = 1

1+𝑒−𝑧. Sigmoid

funktionen gör så att alla ingående värden blir ett tal mellan 0 och 1.

(5)

funktion som ger skillnaden mellan det verkliga utfallet och det förutspådda. [13]

För att minimera kostnadsfunktionen, det vill säga felet, behöver man de partiella derivatorna för varje vikt till kostnadsfunktionen. Gradienten som detta ger pekar i vilken riktning man ska förändra parametrarna för att nå minimum av kostnadsfunktionen och därmed vilka vikter den tränade modellen ska ha. För att veta hur mycket vikterna ska

förändras väljer man en inlärningshastighet. Ju större värde på inlärningshastigheten desto snabbare inlärning men också desto större risk för att missa ett minimum. [13]

När modellen och vikterna är fastställda utifrån träningsmängden undersöks det hur modellen fungerar på testdatasetet. Detta görs på samma sätt som vid

uppbyggnaden/träningen av modellen men utan att förändra vikterna. Ger utfallet i sigmoid funktionen ett värde över decision bound blir det en det en klass och under så blir det den andra. Decision bound väljs för att passa datasetet som undersöks och ett exempel på klasspar är “hemma” och “inte hemma”. [13]

ii) Support Vector Machine

Support Vector Machine (SVM) är liksom Logistic Regression en övervakad maskininlärnings algoritm. Till skillnad från Logistic Regression är SVM dock inte en sannolikhetsbaserad algoritm utan en geometrisk. SVM går ut på att skapa ett beslutsplan som separerar datapunkterna till olika klasser. Är antalet features två blir beslutsplanet en linje men ökar antalet features ökar dimensionerna på beslutsplanet.

VISUALISERING AV SVM

Figur 1: Visualisering av beslutsplan för binärt fall av klassificering med SVM och två features. [14]

När man vill separera datapunkterna finns det inte bara ett beslutsplan. SVMs algoritm går därför ut på att välja det mest optimala beslutsplanet och därmed det plan eller den linje som ger störst avstånd mellan de olika klasserna. Mer optimalt plan innebär säkrare klassificering.

För att ta fram det optimala planet så använder man såsom i Logistic Regression en kostnadsfunktion. Den som används i SVMs är hinge loss. För att minimera kostnadsfunktionen gör man på samma sätt som i Logistic Regression där man beräknar de partiella derivatorna för att ta fram gradienten. Sen uppdaterar man vikterna i gradientens riktning, som är mot minimum, med steglängden av inlärningshastigheten. [15]

iii) Decision Trees

Decision Tree algoritmen för klassificering använder sig av flera logiska if-then villkor. Några av fördelarna med

algoritmen till skillnad från de ovan är att det är en modell

som är enklare att förstå och visualisera. Algoritmen kräver heller inte lika mycket dataförberedelse och de icke-linjära sambanden påverkar inte utfallet och prestandan för modellen. En potentiell nackdel med Decision Trees är att det lätt kan överanpassas till träningsdatasetet och därför kan ha svårt att anpassa sig till nya data. Detta gäller speciellt om det är djupa träd.

VISUALISERING AV DECISION TREE

Figur 2: Visualisering av trädstruktur för Decision Tree Algoritmen Algoritmen går ut på att dela datasetet på ett sätt så att information gain blir så stor som möjligt. Information gain syftar till entropin mellan datasetet innan ett villkor och efter ett villkor. Ett enkelt sätt att tänka på entropi är som ett mått på oordning. Algoritmen byggs upp genom att välja de villkor som ger högst information gain. För att finna vilket villkor detta är så testas alla olika villkor för att se vilket som genererar högst information gain. Detta fortsätter tills dess att träningsdatasetet, om inget annat anges, har delats upp så att det i varje lövnod har entropin 0 eller den lägsta entropin möjlig. En lövnod är en nod eller ett set som inte delas upp i fler noder. När detta är uppnått är modellen byggd med de villkor som ger bästa möjliga klassificering av träningsetet och därför kommer att användas på testdatasetet. [16]

f) Utvärdering av modell

För att utvärdera en klassificeringsmodell finns det olika metoder. Det absolut vanligaste är att man använder sig av något som kallas confusion matrix. I en confusion matrix kan man sedan härleda måtten accuracy, recall och precision. För att kombinera dessa måtts styrkor eller den korrekthet som de belyser är det vanligt att man tar ett viktat medelvärde av täckning och precision, ett så kallat F1-score. F1-score visar hur precis klassificeringen är, det vill säga hur många instanser den klassificerar korrekt, samt hur robust den är, alltså om den missar att klassificera en viss del eller typ av instanser. F1-score kan vara ett bättre mått än accuracy om man har ojämn distribution mellan klasserna. [17]

B. Termiska modellen och lägenhetens effektbalans

(6)

𝑚𝑐𝑝𝜕𝑇_𝜕𝑡𝐼𝑁= 𝑄𝑠𝑜𝑙+ 𝑄𝑖𝑛𝑡+ 𝑄𝑉𝑆− (𝑇𝐼𝑁− 𝑇𝑢𝑡𝑒)(𝜌𝑐𝑝,𝑙𝑢𝑓𝑡[𝑉𝑣𝑒𝑛𝑡(1 −η𝑣𝑣𝑥)+ 𝑉𝑖𝑛𝑓]+ 𝑈𝐴)

[18].

Det man vill lösa ut ur formeln är förändringen av temperatur med tiden. När detta är gjort kan man antingen studera temperaturens förändring när värmesystemets effekt är känd, eller vilken effekt som krävs från värmesystemet för att uppnå en känd temperaturförändring. För att lösa ut temperaturförändringen ur differentialekvationen behövs kunskap och tillgång till data för övriga termer i ekvationen.

Termen mcp i högerledet av ekvationen är lägenhetens

termiska massa. Denna påverkar hur värme kan lagras i lägenheten. Nästa term i ekvationen visar solinstrålningens bidrag till effektbalansen. Solinstrålning bidrar positivt till uppvärmningen av lägenheten, dels genom direkt solinstrålning och dels genom diffus solinstrålning. Solinstrålningen varierar beroende på geografisk plats, väderstreck, år, årstid och tid på dygnet. Effekten av solinstrålningen kommer bero av arean på fönstren, fönstrens genomsläpplighet samt i vilket väderstreck de är placerade.

Förutom solinstrålningen bidrar även internvärmen och värmesystemet till lägenhetens effektbalans. Internvärme är den värme som genereras från personer och maskiner i lägenheten [19] och värmesystemets effekt är den värme som tillförs från lägenhetens värmesystem.

De kvarvarande termerna i formeln representerar värmeförlusterna., Förluster är anledningen till att det finns ett uppvärmningsbehov och uppstår då temperaturen utanför lägenheten är lägre än den inuti vilket medför att värme transporteras från den varmare lägenheten till den kallare omgivningen. Är utomhustemperaturen högre än inomhustemperaturen kan värmeöverföring istället ske till lägenheten från omgivningen. I detta fall sker inga värmeförluster och uppvärmningsbehovet minskar.

Termen ⍴cp är luftens densitet och specifika värmekapacitet.

Den påverkar värmeförlusterna då den beskriver mängden energi som kan transporteras med luften. Värmeförluster kan härledas till tre olika källor vilka motsvarar sista termen i ekvationen ovan. Den första källan till förluster är de som uppkommer genom ventilationssystemet. Förlusternas storlek i ventilationssystem beror på luftens volymflöde samt verkningsgraden hos de eventuella värmeväxlare som finns. Värmeväxlare återvinner en del av värmen i frånluften och tillför den till luften som kommer in i lägenheten. Den andra källan är de förluster som uppkommer genom övrig ventilation, till exempel genom öppnande av fönster. Den tredje förlustkällan är de som sker genom väggar och fönster. Storleken på förlusten genom fönster och väggar beror på dels på byggnadens värmegenomgångstal och dels på infiltrationsflödet. Värmegångstalet skiljer sig mellan olika material samt materialets tjocklek och storlek. Infiltrationsflödet visar hur stort luftläckaget är kring väggar och fönster.

Genom att anta att ovan förklarade variabler är konstanta för varje tidsintervall kan en lösning till differentialekvationen och därmed inomhustemperaturens förändring fås. När lösningen tagits fram kan vi som tidigare nämnt antingen beräkna temperaturen nästföljande timme om värmesystemets effekt är

känd, eller beräkna vilken effekt som krävs från värmesystemet om temperaturen nästföljande timme är känd.

V. METOD

A. Närvaroklassificering

Maskininlärningsmodellerna sattes upp för att avgöra med vilken säkerhet klimatdata kan användas för att avgöra om någon är hemma i en lägenhet. Datasetet för att undersöka detta är taget från KTH Live-In Lab genom deras databas hos Schneider Electrics. Databasen består av data från fyra lägenheter. Utifrån dessa lägenheter valdes en slumpvis lägenhet ut. Anledning till att bara en lägenhet valdes var då alla lägenheter när detta försök gjordes inte hade alla olika features insamlade under den perioden som vi undersökte. I lägenheten samlades variabler in separat för varje rum genom ett flertal olika sensorer. Lägenheten delades in i kök, vardagsrum och badrum. Beräkningarna som har gjorts har använt den data som fanns tillgänglig för vardagsrummet. Detta eftersom det antas vara det rum som personen använder mest samt det rum där mest data fanns att tillgå. Utifrån ritningen antas vardagsrummet också agera sovrum. [18]

Variablerna som fanns att tillgå från vardagsrummet var temperatur, relativ luftfuktighet, koldioxidhalt, belysning, ljusstyrka, reglering, spjäll och närvaro. Utifrån jämförelse med tidigare studier valdes i maskininlärningsmodellen att undersöka relativ luftfuktighet (RH), koldioxidhalten (ppm), temperatur (℃) och ljusstyrka (lux).

TABELL 1

HEADS FÖR UCI:s OCH KTH LIVE-IN LAB:s DATASET

DateTime Temperature Humidity Light CO2 Occupancy

2015-02-02 14:19 23.7 26.272 585.2 749.2 1 2015-02-02 14:20 23.718 26.29 578.4 760.4 1 2015-02-02 14:21 23.73 26.23 572.66667 769.6667 1

DateTime Ljusstyrka Koldioxid Luftfuktighet Temperatur Närvaro

2020-02-25 01:30 51.360000 638.528003 28.461538 19.770000 1 2020-02-25 02:30 51.360000 632.853333 28.461538 19.670000 1 2020-02-25 03:30 51.360000 624.533325 27.333333 19.670000 1

Algoritmerna skulle tillämpas på binär klassificering, det vill säga hemma eller inte hemma, och därför blev det första steget hantera närvaron. Närvaron för vardagsrummet i KTH Live-In Lab registrerades med hjälp av en IR-sensor av modell KNX-NÄRVARODET 360 BASIC PV. Sensorn var placerad i taket på en höjd av 2,2 m och registrerade värden mellan 0 och 1, där 0 var frånvarande, 1 var närvarande och allt däremellan osäkert. I datasetet från UCI hade man inte denna osäkerhetsfaktor då närvaron istället för med hjälp av en IR-sensor registrerades manuellt från kameraövervakning av kontoret [6].

(7)

avrundas till närmaste heltal. När värdet var exakt 0,5 blev antagandet att data under natten, det vill säga mellan klockan 01:00 och 08:00, var hemma och övriga tider borta. Detta antagande gjordes då den data som innehöll enbart ettor och nollor tydde på att personen i lägenheten brukar vara hemma mellan de specificerade klockslagen. Tiden för datapunkten användes inte i sig som en faktor för att estimera närvaro.

Utifrån den framtagna närvaron på KTH Live-In Labs data och dess tidsserie användes sedan Excel för att länka ljusstyrka, koldioxidhalten, relativa luftfuktigheten och temperatur till samma tidsserie. Tidsperioden som valdes från KTH Live-In Labs dataset var 2020-02-25 till 2020-04-14 då detta var det längsta kontinuerliga tidsintervallet. Detta innebar i slutändan 3225 unika datapunkter för datasetet från KTH medan UCI:s dataset bestod av 20561 datapunkter under enbart ett intervall på 2 dagar. Se Appendix 3 och 4.

Under tiden som processeringen och sammanslagningen av KTH:s data undersöktes alltid hur korrelationen förändrades mellan de olika featuresen. Det slutgiltiga datasetet sparades i en csv-fil för att enkelt kunna läsa in och använda i Python.

För att implementera maskininlärningen användes Pythons inbyggda masikinlärningspaket scikit-learn. Datasetet delades först in i ett träningsset och ett testset, där 70% blev träningsset och resten testset.

Efter detta tränades och applicerades de tre olika modellerna med scikit-learns inbyggda algoritmer; DecisionTreeClassifier med kriteriet entropi, SVC som är en Support Vector Machine algoritm och LogisticRegressionCV med k-fold cross-validation utförd fem gånger. Hyperparametrarna varierades annars inte i implementeringen utan då användes Pythons standardinställningar.

Slutligen undersöktes hur väl modellerna har presterat genom beräkningar av accuracy, F1-score och en confusion matrix. Försöken upprepades för alla algoritmer och kombinationer av features. För att jämföra hur vår data presterat gjordes också samma försök med datasetet som fanns att hämta hos UCI och tidigare studier utförts på.

B. Termiska modellen

Det grundläggande antagandet som görs när den termiska modellen ställs upp är att en helt korrekt närvarobedömning kan genomföras. Utifrån det antagandet ställs den termiska modellen upp för att utvärdera om adaptiv uppvärmning kan leda till energibesparingar i uppvärmningen av lägenheter. Genom att undersöka eventuella skillnader mellan uppvärmningsbehovet med och utan adaptiv uppvärmning kan man få fram eventuella energibesparingar. Det här avsnittet kommer först gå igenom det statiska fallet och därefter det adaptiva fallet. Därefter förklaras vilka antaganden, förenklingar och delberäkningar som har gjorts. I Appendix 5 går det att läsa en ännu mer djupgående förklaring av hur modelleringen har skett i Excel.

a) Modellering av det statiska fallet

Lägenhetens temperatur är i det statiska fallet, som inte är beroende av närvaroestimering, given för varje timme. Den sätts lika med den temperatur som angivits av

temperatursensorn i vardagsrummet i en av lägenheterna i KTH Live-In Lab. Med hjälp av övrig indata som går att finna i Appendix 2 kan då värmesystemets effekt beräknas genom att lösa ut QVS ur formeln för lägenhetens effektbalans (se B:

Termiska modellen och lägenhetens effektbalans). b) Modellering av det adaptiva fallet

Den adaptiva modellen tar i beräkningarna för värmesystemets effekt hänsyn till närvaron i lägenheten. Om ingen är hemma kommer värmesystemet att vara avstängt och alltså tillföra 0W till lägenheten. När någon är hemma finns två olika scenarion. Om temperaturen är över eller lika med önskad boendetemperatur används samma formel som i det statiska fallet. Om temperaturen istället är under önskad boendetemperatur modelleras värmesystemets effekt så att temperaturen när nästa timme börjar är lika med den önskade boendetemperaturen.

För modellen har 22,9 grader valts som den temperatur som är önskvärd i lägenheten eftersom det var medeltemperaturen i den statiska modelleringen. Denna temperatur används som måltemperatur för att eventuella energibesparingar mellan det statiska och adaptiva fallet inte ska bero på en förändrad boendetemperatur utan hur man kan anpassa temperaturen efter närvaro.

För att beräkningen av värmesystemets effekt ska kunna ta hänsyn till vilket scenario som gäller har Excel använts. Den närvarodata som använts är en sammanslagning av de avläsningar som gjorts i de tre närvarosensorerna i en KTH Live-In Lab lägenhet. Det innebär att närvarodatan som använts i modellen säger att någon är hemma om någon av de tre sensorerna indikerat att någon är hemma. Anledningen till att denna närvarodata använts istället för den närvarodata som använts i maskininlärningen är att den termiska modellen ser lägenheten som ett enda rum medans det i maskininlärningen skiljs på vardagsrum, kök och badrum vilket kommer påverka resultatet.

c) Antaganden

För att uppvärmningsbehovet i de två fallen ska kunna beräknas behöver delberäkningar och antaganden göras. Om antaganden inte görs blir modellen för komplex och osäker.

Den första förenkling som gjorts i modellen är att förlusterna genom övrig ventilation försummas. Det antas att de boende för det mesta inte vädrar och luftflödet vid vädring är svårt att uppskatta. Vidare antas det att värmegenomgångstalet inte varierar med tiden. En uppskattning av värmegenomgångstalet har gjorts genom att ta värdet för putsad betong, som är ett vanligt byggmaterial, och sedan ta hänsyn till att fönstren har ungefär tio gånger högre värmegenomgångstal än väggarna. [20][21] Genom att sedan ta hänsyn till förhållandet mellan fönstrens och väggarnas area kan ett värmegenomgångstal för lägenheten beräknas.

(8)

uppskattning på väggarnas tjocklek [22], väggarnas area samt värmelagringsförmågan hos betong.[21] Tak och golv har inte inkluderats i beräkningarna. Värdet på infiltrationsflödet har beräknats med formeln 𝑉_𝑖𝑛𝑓=𝐴𝐶𝐻∗𝑉

3600 [21] där ACH (air

changes per hour) togs ur tabell [23] och V är lägenhetens volym.

Lägenhetens area mot uteluften beror på lägenhetens placering i huset. Det kommer antingen vara en kortsida eller en långsida och en kortsida som är exponerad mot uteluften. KTH Live-In Lab lägenheterna är placerade längre ner i byggnaden och ingen av dem har därmed taket exponerat mot uteluften. Därför har scenariot att lägenheten har taket exponerat mot uteluften inte undersökts.

Ytterligare en förenkling som gjorts i modellen är att förluster genom väggar som angränsar mot andra lägenheter eller korridoren försummas. Det här görs dels för att temperaturen i dessa områden troligtvis liknar dem i lägenheten vilket medför små värmetransporter samt att modellen blir mycket mer komplex.

För att beräkna effekten av den solinstrålning som bidrar i lägenhetens effektbalans görs också antaganden. Ett antagande är att enbart solinstrålningen som träffar fönstren bidrar till lägenhetens effektbalans. Vidare tas det hänsyn till att inte all solinstrålning som träffar fönstret påverkar effektbalansen då en del av strålningen reflekteras.

Internvärmen har antagits anta endast två olika värden. Ett lägre värde när ingen är hemma som kommer från vitvaror och hemelektronik och ett högre värde när någon är hemma som då också inkluderar värmen som människan avger till lägenheten. [23] Modellen tar dock ej hänsyn till extra värme som avges från elektronik vid användning eller att mer än en person kan befinna sig i lägenheten.

Eftersom många av variablerna baseras på antaganden har störningsberäkningar gjorts med variablerna för att se dess påverkan på modellens resultat. Detta har gjorts genom att undersöka effekten av att störa en variabel i taget med först plus tio procent och sedan minus tio procent. För värmeväxlaren har endast fallet med minskad verkningsgrad undersökts då den installerade redan har maximal effekt enligt Joachim Claesson universitetslektor på KTH. Det har även undersöks hur stor besparingen är om två sidor av lägenheten är mot uteluften istället för endast en sida.

VI. RESULTAT

För KTH Live-in Labs dataset kan man se stora skillnader mellan de olika algoritmernas prestation men ett tydligt samband i vilka features som bäst avgör om någon är hemma eller inte.

TABELL 2

JÄMFÖRELSE MELLAN DE TRE ALGORITMERNA SOM GAV HÖGST ACCURACY FÖR KTH LIVE-IN LAB

Model Features Accuracy training Accuracy F-score

DT Ljus, CO2 98,95 94,05 93,61

SVC Ljus, CO2 77,82 76,84 77,25

LR Ljus, CO2, temp 68,17 71,74 72,54

Utifrån försöken kan man se att faktorerna som bäst lyckats klassificera närvaro för alla de tre olika algoritmerna är kombinationen av ljus och koldioxid. Logistic Regression har förvisso också temperaturen som feature men skillnaden mellan att ha med temperaturen och inte var enbart 0,4%. Det man också ser är att Decision Tree algoritmen är överlägset bäst med 94% accuracy.

Givet att man skulle kunna uppnå 100% korrekthet för estimering om någon är hemma eller inte kan man utifrån den termiska modellen se att den procentuella energibesparingen mellan den 9 - 31 januari, 22 dagar, skulle vara 1,3 - 10,1%. Detta motsvarar energibesparingar på 1,2 kWh till 12,9 kWh och med det befintliga energipriset för en liten lägenhet under 2019, 2,5 kr/kWh [24], skulle detta innebära kostnadsbesparingar på mellan 3 - 32 kronor. Detta är alltså kostnadsbesparingarna för en enrumslägenhet under lite drygt 3 veckor.

VII. DISKUSSION

I diskussionen kommer vi först diskutera trovärdighet kring resultaten och data för att sedan övergå i en diskussion kring tillämpning och de praktiska möjligheterna för implementering. Den första aspekten som troligtvis har stor inverkan på våra resultat är precisionen, kvaliteten och hanteringen av data. Detta kan man se genom att jämföra resultaten som datasetet från UCI hade på de olika algoritmerna och det resultatet KTH Live-In Labs data gav där resultatet oavsett algoritm var mycket jämnare för UCI:s än för KTH Live-In Labs dataset. Detta tyder på att datan som UCI hade är mer precis än KTH Live-In Labs då en algoritm som Logistic Regression kräver mycket dataförberedelse och starkare korrelation för en hög accuracy än vad en Decision Tree algoritm gör.

Om man jämför resultatet med studien av Luis M. Candanedo och Véronique Feldheim så kan man se att två features generellt räcker för hög korrekthet men att våra resultat snarare pekar på att fler features faktiskt innebär bättre resultat om än marginellt speciellt på deras data.

Om man väljer att fokusera på de features som överlag presterar bäst på både KTH:s och UCI:s data, ljus och koldioxid, då korrektheten skiljer sig mindre än 1% om man lägger till flera features (Se Appendix 3) kan man dra jämförelser både mellan prestationen för LDA kontra Logistic Regression samt prestationen för datasetet. Logistic Regression med ljus, CO2 på KTH:s data var 71.74%, enligt Luis M. Candanedo och Véronique Feldheim studie med samma features och med datan som finns tillgänglig hos UCI på algoritmen LDA blev korrektheten 97.86% [6] och med samma data på Logistic Regression blev korrektheten 98.87% (Se Bilaga 3). Detta visar att Logistic Regression som Robert Brownlee menar visst är en algoritm som skulle vara lämplig att använda om man har fler features bara en men det visar också vikten av korrekt insamlade data som tidigare studier [6],[8] menar då KTH:s data presterar avsevärt sämre.

(9)

energibesparingar.

TABELL 3

JÄMFÖRELSE MELLAN DE TRE ALGORITMERNA SOM GAV HÖGST ACCURACY FÖR UCI

Model Features Accuracy training Accuracy F-score

DT Ljus, fukt, CO2 100 99.16 98.21

SVC Ljus, fukt, CO2, temp 99.05 98.93 97.76

LR Ljus, CO2, temp 98.93 98.95 97.80

KTH Live-In Labs närvarodata för vardagsrummet hade i 48% av fallen värdet 0,5. Detta betyder att hälften av närvarodatan påverkas av antagandet om att närvaron skulle kunna avgöras baserat på tid på dygnet. I studien av Luis M. Candanedo och Véronique Feldheim registrerades närvaron istället för med IR-sensor med en kamera som man sedan manuellt studerade och använde som label. Detta innebar att de inte behövde göra några antaganden och kunde undvika osäkerhet i datainsamlingen från sensorer eftersom de med sina egna ögon kunde avgöra om någon var närvarande. Det här skulle dock inte kunna appliceras i stor skala och därmed inte ett alternativ för att fungera som styrsystem vid adaptiv uppvärmning.

Att ha närvarosensorer eller rörelsesensorer skulle kunna vara ett alternativ för närvarodetektering men som den här studien visar så är inte det heller en garanti för att säga om någon är hemma eller inte då den var osäker i 48% av fallen och att det därför skulle behöva vara bättre sensorer eller i alla fall bättre montering än vad som utförs i KTH Live-In Labs lägenheter idag. Troligtvis är monteringen en större faktor en val av sensor då det finns studier som visar att IR-sensorer ska fungera bra för att detektera närvaro och rörelse samt att de är gjorda för specifikt det syftet. [11] Att använda närvarosensorer eller rörelsesensorer ställer också krav på att människor är villiga till detta och troligtvis är så inte fallet [7] utan skulle vara mer villiga att ha koldioxid- och ljussensorer, även om utfallet i de båda scenarierna är den samma det vill säga detektera närvaro.

Annan orsak till varför det skulle kunna vara svårt att uppnå den grad av närvarodetektering som UCI:s dataset uppnådde är att miljön och beteendemönstret skiljer sig mellan en lägenhet och ett kontor. UCI:s dataset, som är insamlat i en kontorsmiljö, visade korrelation mellan ljusstyrka och närvaron på 0,91. Denna korrelation kan man se i Bilaga 3 hade väldigt stor påverkan på utfallet där genomsnitts korrektheten utan featuren ljusstyrka ligger på 85% och inte över 90 som annars är fallet. I och med att en boende i en lägenhet inte nödvändigtvis har ett lika regelbundet närvaroschema som arbetstider i ett kontor är det svårt att se att man skulle kunna uppnå samma resultat som UCI:s dataset med featuren ljusstyrka inkluderat vilket Brownlee också anmärker i sin artikel [8].

Skulle man också vilja använda närvarodetektering för mer än en enskild lägenhet skulle detta innebära att man behöver träna upp nya modeller för varje lägenhet. Det skulle möjligtvis gå att använda samma modell för liknande bostäder men mer

storskaligt än samma hus är svårt att se att man skulle kunna uppnå med en och samma modell då data troligtvis skiljer sig mycket från fall till fall, till exempel placering av lägenheten i byggnaden. Har man också som ambition att uppnå närvarodetektering på 100% skulle mängden data man behöver vara väldigt stor vilket kanske inte är realistiskt att ha för hela bostadskomplex eller kanske till och med hela landet. Tummar man med korrektheten i modellerna ökar risken att sänka boendekomforten och minska nyttan från den adaptiva uppvärmningen men som tas upp i tidigare studier så är det inte kanske nödvändigt om implementationen enbart är för värme, ventilation och luftkonditionering. [11]

Förutom att antagandet om närvarodetektering är svårt att uppfylla, 100 % korrekthet, har även övriga antaganden som gjorts en påverkan på resultatet för energibesparingarna. De osäkerheter övriga antaganden medför har hanterats genom att utföra störningsberäkningar och presentera den resulterande energibesparingen i ett intervall istället för att presentera det som ett absolut värde.

Trots dessa åtgärder för att minska modellens osäkerheter är det svårt att utifrån denna studies resultat dra några generella slutsatser om adaptiv uppvärmning kan bidra till Sveriges strävan mot de globala målen genom att minska energiförbrukningen inom bostadssektorn. Detta då modellen av flera anledningar inte utgör ett tillräckligt underlag för att dra en generell slutsats för hela Sverige. Till att börja med kan byggnadsdata som används i modellen skilja sig mycket mellan KTH Live-In Lab och andra enrumslägenheter. Resultatet säger inte heller om energibesparingen är högre eller lägre i större lägenheter. Påverkan av antalet boende i lägenheten och hur mycket de är hemma bör också undersökas för att kunna dra en generell slutsats.

Vidare behöver också beräkningar göras med väderdata från olika delar av landet då utetemperatur och solinstrålning skiljer sig beroende på geografisk plats. Man bör också modellera energibesparingen över ett helår och inte bara för en treveckorsperiod i januari för att kunna uttala sig om effekterna på energiförbrukningen i bostadssektorn. Det bör också undersökas hur besparingarna påverkas om adaptiv uppvärmning införs i flera lägenheter i samma hus. Det är troligt att det skulle leda till ökade temperaturskillnader mellan lägenheterna som kan påverka resultatet av den adaptiva uppvärmningen. Det har inte heller undersökts hur effekterna påverkas av den valda boendetemperaturen. Därmed vet vi inte om adaptiv uppvärmning har samma påverkan när boendetemperaturen är lägre eller högre än 22,9 grader.

Vad som går att konstatera är att denna studie visar att adaptiv uppvärmning har potential att vara med och bidra till en minskad energiförbrukning i den svenska bostadssektorn, men vidare studier behöver genomföras för att fastställa om denna besparing skulle vara märkbar.

(10)

sensorer och datahantering. Om befintliga sensorer kan användas kan kostnaderna som extra närvarosensor innebär undvikas [7]. Detta skulle innebära att incitamenten att införa närvarodetektering med hjälp av andra sensorer också skulle öka. Om kostnaderna för införandet av den adaptiva uppvärmningen kan hållas väldigt låga skulle möjligtvis kostnadsbesparingarna i ett helt lägenhetskomplex över ett år möjligtvis ändå motivera till ett införande. Troligtvis är det dock inte bara de ekonomiska faktorerna som skulle göra implementeringen av adaptiv uppvärmning attraktivt utan också det ökade fokuset på hållbarhet, bekvämlighet och innovation.

I ett samhälle där hållbarhet får en allt större betydelse och inverkan på människors val har adaptiv uppvärmning möjlighet att göra lägenheter attraktivare för köpare på bostadsmarknaden. Genom att framhäva att lägenheten har ett automatiskt system för att reglera uppvärmningen kan den framställas som ett hållbart, bekvämt och innovativt alternativ. Om dessa faktorer kan bidra till att göra lägenheter mer attraktiva på bostadsmarknaden är värdet av adaptiv uppvärmning plötsligt större än om man enbart studerar de konkreta ekonomiska besparingarna av en minskad uppvärmning. Huruvida detta faktiskt är fallet är svårt att veta utan att genomföra marknadsundersökningar och vidare studier.

Ett sätt att fördjupa diskussionen och ytterligare öka intresset och värdet av adaptiv uppvärmning vore att utnyttja närvarodetektering till fler tjänster än att minska energiförbrukningen i hushållet. Idag finns en synbart ökad trend i bostadssektorn för smarta hem. Många av funktionerna styrs dock med en applikation eller rösten vilket ger potential för att göra det ännu smartare genom automatiserade styrsystem via närvarodetektering. Ett exempel är att det skulle vara möjligt att införa automatisk ljusreglering. Det skulle innebära att belysningen automatiskt kan regleras beroende på om någon är hemma eller inte samt vilken ljusstyrka som det är i rummet för tillfället. En annan möjlighet som uppstår är att systemet kan minska ventilationsflödet när ingen är hemma, vilket skulle minska värmeförlusterna och därmed kunna öka energibesparingen från den adaptiva uppvärmningen.

SWOT-ANALYS

Bild 3: SWOT-analys för integrering av närvarodetektering och adaptiv uppvärmning i en tjänst för smarta hem

VIII. SLUTSATS

Marknadsförs adaptiv uppvärmning som ett värdeerbjudande med minskad energiförbrukning och tjänster för ett smart hem har det troligen större potential att införa än om det marknadsförs som en kostnadsbesparande tjänst. Ett värdeerbjudande för smarta hem med automatiska inslag skulle passa väl in i dagens samhälle som har ett stort fokus på hållbarhet och innovation. Även om kunden inte tjänar pengar på energibesparingen kan värdeerbjudandet fortfarande vara lockande då det fokuserar på andra aspekter av tjänsten än endast den adaptiva uppvärmningen och lägger vikten vid hållbarhet och bekvämlighet istället för ekonomi. Därmed skulle en energibesparing också kunna uppnås trots de små kostnadsbesparingarna det motsvarar för konsumenterna. Införandet av ett sådant värdeerbjudande förutsätter dock att bättre närvarodetektering kan göras i lägenheter än de resultat som uppnåtts i denna rapports studier på KTH Live-In Labs lägenheter. Innan närvaron kan bedömas mer korrekt är ett införande av den tjänst som diskuterats inte realistisk då boende komforten skulle kunna äventyras om modellen inte fungerar korrekt. Vidare studier behöver därmed göras innan automatiserad adaptiv uppvärmning kan införas som en kommersiellt gångbar tjänst som kan vara med och bidra till en minskad energiförbrukning i Sverige.

REFERENSER [1] Globalportalen. Agenda 2030. https://globalportalen.org/amnen/agenda-2030 (Hämtad 2020-02-25) [2] Energimyndigheten. Energiläget 2019. https://energimyndigheten.a-w2m.se/Home.mvc (Hämtad 2020-02-25)

[3] Folkhälsomyndigheten. Temperatur inomhus.

https://www.folkhalsomyndigheten.se/livsvillkor- levnadsvanor/miljohalsa-och-halsoskydd/tillsynsvagledning-halsoskydd/temperatur/ (Hämtad 2020-02-26)

[4] Danfoss. Smart uppvärmning https://www.danfoss.com/sv-

se/markets/buildings-residential/dhs/solutions-for-homeowners/saving-energy/ (Hämtad 2020-05-06)

[5] Svensk Nationell Datatjänst. Kostnader för hantering av data. 2019.

https://snd.gu.se/sv/hantera-data/data-i- forskningsprocessen/datahanteringsplan/kostnader-hantering-av-data (Hämtad 2020-05-07)

[6] Candanedo, L. M., & Feldheim, V. (2016). Accurate occupancy detection of an office room from light,

temperature, humidity and CO2 measurements using statistical learning models. Energy and Buildings, 112, 28-39.

(11)

[8] Pedersen, T. H., Nielsen, K. U., & Petersen, S. (2017). Method for room occupancy detection based on trajectory of indoor climate sensor data. Building and Environment, 115, 147-156.

[9] James, Gareth, et al. “An Introduction to Statistical Learning: with Applications in R.” Springer, 2017,

https://link.springer.com/content/pdf/10.1007/978-1-4614-7138-7.pdf

[10] Brownlee, J. How to Predict Room Occupancy Based on Environmental Factors. 2018.

https://machinelearningmastery.com/how-to-predict-room-occupancy-based-on-environmental-factors/ (Hämtad 2020-05-01)

[11] Hailemariam, E., Goldstein, R., Attar, R., & Khan, A. (2011, April). Real-time occupancy detection using decision trees with multiple sensor types. In Proceedings of the 2011 Symposium on Simulation for Architecture and Urban Design (pp. 141-148).

[12] Nationalencyklopedin. Maskininlärning.

http://www.ne.se/uppslagsverk/encyklopedi/lång/maskininlärn ing (Hämtad 2020-02-25)

[13] Jurafsky, D. & Martin, J.H., “Evaluating Language Models”, Speech and Language Processing, 3rd ed. Stanford, 2019.

[14] Gandhi, Rohith. Support Vector Machine — Introduction to Machine Learning Algorithms. 2018. Towards data science.

https://towardsdatascience.com/support-vector-machine-introduction-to-machine-learning-algorithms-934a444fca47

(Hämtad 2020-05-01)

[15] Varma, Rohan. Picking Loss Functions - A comparison between MSE, Cross Entropy, and Hinge Loss. 2018.

https://rohanvarma.me/Loss-Functions/ (Hämtad 2020-05-01) [16] Singh Chauhan, Nagesh. Decision Tree Algorithm — Explained. 2019. https://towardsdatascience.com/decision-tree-algorithm-explained-83beb6e78ef4 (Hämtad 2020-05-01) [17] Ping Shung, Koo. Accuracy, Precision, Recall or F1?. https://towardsdatascience.com/accuracy-precision-recall-or-f1-331fb37c5cb9 (Hämtad 2020-05-01)

[18] Claesson, Joachim. Energianvändning i byggd miljö. Föreläsning på KTH 2019-03-28 i kursen MJ1145. [19] Bygghandling KTH Live In Lab. 2018. Material från Jonas Anund Vogel.

[20] Jernkontorets energihandbok. Värmeledningsförmåga och U-värden för olika material.

https://www.energihandbok.se/konstanter/varmeledningsform aga-och-u-varden-for-olika-material (Hämtad 2020-04-30)

[21] Claesson, Joachim. Crash course in single zone building modelling. s. 12, s. 48-52

[22] J.M.K.C. Donev et al. (2015). Energy Education - Thermal mass. University of Calgary.

https://energyeducation.ca/encyclopedia/Thermal_mass. (Hämtad 2020-05-01)

[23] Claesson, Joachim. Energianvändning i byggd miljö #2. Föreläsning på KTH 2019-03-29 i kursen MJ1145.

[24] Energimarknadsbyrån. Normal förbrukning och elkostnad för lägenhet. 2020.

https://www.energimarknadsbyran.se/el/dina-avtal-och- kostnader/elkostnader/elforbrukning/normal-elforbrukning-och-elkostnad-for-lagenhet/ (Hämtad 2020-05-09)

Ingrid Åsenius är född 1997 i Huddinge och

studerar tredje året på civilingenjörsprogrammet i industriell ekonomi med inriktning mot datateknik och kommunikation på Kungliga Tekniska Högskolan i Stockholm. Ingrid har haft huvudansvaret för maskininlärningsdelen och därmed den närvarodetektering som utförts.

Emil Vik är född 1998 i Upplands Väsby och

studerar tredje året på civilingenjörsprogrammet i industriell ekonomi med inriktning mot energisystem och hållbar utveckling på Kungliga Tekniska Högskolan i Stockholm. Emil har haft huvudansvaret för att ta fram modellen för den adaptiva uppvärmningen och utifrån detta beräkna de möjliga ekonomiska besparingarna. A. Appendix 1

Resultatet av störningsberäkningarna i den termiska modellen.

Variabel* Maximal besparing

vid störning

Minimal besparing vid störning

Termiska massan 7,01% 1,34%

Totalt flöde av uteluft 5,19% 3,87%

Infiltrationsflöde 5,13% 3,70%

Verkningsgrad värmeväxlare 9,98% -**

Två sidor av lägenheten angränsar mot uteluften istället för en

10,05% -

B. Appendix 2

Värden på de variabler som använts i den termiska modellen.

Namn Värde Namn Värde

Totalt flöde av uteluft

30 liter/sekund Verkningsgrad

värmeväxlare

(12)

Dimensioner lägenhet 4*6*2,2 meter Fönsterarea 2 m2 Transmission fönster 70% Utetemperatur, solinstrålning Se bilaga ⍴luft 1,205 kg/m3 cp,luft 1006 J/(K*kg) Qint 61,64 W när ingen är hemma 161,64 W om någon är hemma Infiltrationsflöde, Vinf 0,002933 m3/s Termiska massan 24 781 680 J/K Värmegenomgångstalet, U 0,266 W/(m2*K) C. Appendix 3

Resultattabell för alla närvarodetekteringsförsöken.

https://drive.google.com/open?id=1nYUNkvnIj3X4hyEcUcxI 3eN3KLXYGHSf

D. Appendix 4

Datasetet från UCI som används i flera av de tidigare studierna

https://drive.google.com/open?id=14ZHzV4m0W2mg1mcG1

nhUQQXz0Ua8Ovjb

E. Appendix 5

Nedan följer en mer djupgående beskrivning av hur uppvärmningen av lägenheten har modellerats än den som presenteras i rapporten. Modellen bygger vidare på kunskaper från kursen MJ1145 på KTH. Fullständiga modellen kan nås via länken

https://drive.google.com/file/d/1-tKj6Of2Mxn8oBlFPBuOJPkeSYdkmPJk/view?usp=sharing

Först modellerades det statiska fallet. Det är fallet där adaptiv uppvärmning inte är införd och modelleras för att uppskatta hur mycket energi som krävs för att värma upp den undersökta lägenheten utan att några ändringar införs. Beräkningarna gjordes för perioden 1 januari till 31 januari, men i jämförelsen togs endast resultatet för 9-31 januari med då närvarodata för den undersökta lägenheten saknades för perioden 1-8 januari. För perioden utan data skrevs det i modellen in att den boende hela tiden var hemma, detta för att startvillkoret timme 0 den 9 januari skulle vara detsamma för de två modellerna.

De gulmarkerade cellerna i Bild 1 innehåller väderdata för varje given timme. Väderdatan är insamlad i Strömstad 1995 och är taget från kursen MJ1145 på KTH vårterminen 2019. Väderdatan innehåller direkt och diffus solinstrålning för varje väderstreck samt utomhustemperaturen. Väderdata

innehållandes både direkt och diffus solinstrålning för Stockholm för varje timme hittades ej, vilket är varför data för Strömstad användes istället.

Bild 1: Rubriker del 1 för statiska fallet

Arean på kortsidan och långsidan skattades utifrån

byggnadsritningar på den undersökta lägenheten. Även arean på fönstren skattades med denna metod. Termen Andel genomsläppt visar fönstrens transmission. Transmissionen på KTH Live-In Labs lägenhets fönster var ej känd så värdet togs från rapporten Byggnaders energianvändning – en

modellering (Agering et al, 2019). Den termiska massan var inte heller känd. Den beräknades istället analytiskt genom att multiplicera väggarnas area med deras tjocklek och

värmelagringsförmågan hos betong (se beskrivningen av antaganden i rapporten för källhänvisningar). Densiteten för torr luft och den specifika värmekapaciteten för luft togs från boken Applied Thermodynamics; Collection of Formulas av Hans Havtun. Totalt flöde av uteluft och verkningsgraden för värmeväxlaren har fåtts genom intervju och mailkontakt med Jonas Anund Vogel på KTH Live-In Lab. Infiltrationsflödet beräknades med formeln Vinf=ACH*V/3600. Formeln är tagen

från kompendiet Crash course in single zone building modelling av Joachim Claesson. ACH (air changes per hour) togs ur tabell i samma kompendium. Area mot utsida används i beräkningarna eftersom endast sidan/sidorna som angränsar mot uteluften kommer ha ett värmeutbyte med den omgivande uteluften.

Bild 2: Rubriker del 2 för statiska fallet

Qsol visar solinstrålningens bidrag till lägenhetens effektbalans.

I modellen antogs det i ursprungsfallet att fönstren pekade mot norr. Beräkningar gjordes även för de andra väderstrecken, men påverkan av fönstrens placering var liten. Qsol beräknades

genom att multiplicera summan av den diffusa och direkta solinstrålningen (som är angiven per kvadratmeter) med fönstrens area och deras transmission. Qint visar internvärmens

bidrag till uppvärmningen. Värdet sattes till 161,6 W om någon var hemma och 61,6 W om ingen var hemma. 100 W är ungefär vad en person avger i värme och 61,6 W är en

skattning av värme från elektronik och vitvaror som tagits från rapporten Byggnaders energianvändning – en modellering. Ti

visar inomhustemperaturen för timme i och är i det statiska fallet givet genom en temperatursensor i den undersökta lägenheten. Det har antagits att hela lägenheten har samma temperatur. T∞och Ti+1 används inte i det statiska fallet

eftersom temperaturen är känd för varje timme och inte behöver beräknas analytiskt. Värmesystemets effekt QVS

beräknas med följande formler

Värmesystemets effekt = luftens temperaturförändring - gratis tillförd effekt + förluster

luftens temperaturförändring = cp,luft*ρluft*(Ti-Ti-1)

(13)

förluster=(Ti-Tute)*(Total flöde av uteluft*cp,luft*(Totalt flöde av

uteluft*(1-verkningsgrad vvx)+Infiltrationsflöde)+U*Area mot utsidan)

Det är genom att summera värmesystemets effekt för varje timme under perioden 9-31 januari som uppvärmningsbehovet under perioden fås. Denna jämförs sedan med behovet i det adaptiva fallet och den procentuella besparingen redovisas i kalkylarket.

Bild 3: Rubriker, exklusive tid och väderdata, för adaptiva fallet.

Väderdatan, Qsol och Qint är likadana i det adaptiva fallet. Även

all byggnadsdata är densamma. Skillnaden mellan de två fallen ligger i hur värmesystemets effekt, QVS, modelleras

samt att temperaturen för varje timme inte är känd i det adaptiva fallet utan istället kommer bero på uppvärmningen. Värmesystemets effekt kommer bero på om någon är hemma eller inte samt vilken temperatur det är i lägenheten. Om ingen är hemma modelleras värmesystemet som avstängt. Om någon är hemma används samma formler som i det statiska fallet, med modifieringen att om temperaturen i lägenheten är lägre än den önskade boendetemperaturen så ersätter den önskade boendetemperaturen Ti i formeln. Detta eftersom det i fallet att

lägenhetens temperatur understiger den önskade temperaturen så kommer lägenheten behöva värmas upp till denna

temperatur vilket gör att Ti=önskad boendetemperatur kommer

att gälla. Önskade boendetemperatur valdes till 22,9 grader då detta var medeltemperaturen i det statiska fallet.

I det adaptiva fallet behöver också temperaturen för nästföljande timme beräknas. Om ingen är hemma beräknas denna temperatur analytiskt med två formler;

T∞är temperaturen när steady-state nåtts. Båda formlerna

kommer från föreläsningsmaterialet med Joachim Claesson i kursen MJ1145 vårterminen 2019 på KTH. De återfinns även i kompendiet Crash course in single zone building modelling. Dessa två formler beskriver tillsammans hur mycket temperaturen sjunker till nästföljande timme när värmesystemet är avslaget.

Om någon är hemma kommer temperaturen nästföljande timme bero av den nuvarande temperaturen. Om temperaturen understiger 22,9 grader kommer temperaturen nästa timme vara lika med 22,9 grader eftersom värmesystemets effekt har modellerats för att höja temperaturen till denna nivå. Om temperaturen däremot redan är över eller lika med 22,9 grader så kommer temperaturen vara densamma nästa timme

eftersom värmesystemet då är modellerat för att bibehålla temperaturen i lägenheten.

(14)