• No results found

5. Genomförande

6.1 Resultat för PCA

Cross-validation med metoden generalized cross-validation och smooth cross-validation gav 13 respektive 4 principalkomponenter. Den screeplot som skapades presenteras i figur 3. Screeplotten visar att principalkomponent 1 och 2 förklarar 35.2 % respektive 25.4 % av datamaterialets totala varians. Sammanlagt förklarar de fyra första principal komponenterna 81.5 % av datamaterialets totala varians.

Figur 3. ​ Screeplot som visar hur stor del av den totala variansen förklaras av respektive principalkomponent.

Analysen valdes att göras på 2 principalkomponenter och plottar och information som

presenteras i resterande del av detta avsnitt om PCA ger därmed information för de två första principalkomponenterna.

I figur 4 och 5 presenteras contributionplots. I dessa är principalkomponent detsamma som dimension, det vill säga principalkomponent 1 är ekvivalent med dimension 1 och

principalkomponent 2 är ekvivalent med dimension 2. Den streckade röda linjen i figur 4 och 5 motsvarar det förväntade bidraget från en variabel givet att alla variablers bidrag skulle vara lika stort. Variabler med ett bidrag som motsvarar en stapel som överskrider den streckade

röda linjen anses vara värdefulla för en modell. Resultatet visade att vindbox 15, vindbox 16, vindbox 17, vindbox 13 och vindbox 18 är de fem variabler som bidrar mest

principalkomponent 1. Motsvarande för principalkomponent 2 är vindbox 4, vindbox 5, vindbox 6, vindbox 7 och vindbox 3. Samtliga nämnda överstiger den streckade, röda linjen i grafen och de är alla vindboxar. Ingen av variablerna som tillhör gratevagnen finns med bland de tio mest bidragande variablerna för varken principalkomponent 1 eller 2. Även bidraget till principalkomponent 1 och 2 tillsammans undersöktes. Inte heller här fanns någon av

gratevagnens variabler med bland de 10 variabler mest störst bidrag.

Figur 4.​ De tio variabler som bidrar mest till principal komponent 1.

I figur 6 är loadingkoordinater för alla variabler plottade i en korrelationscirkel. Färgen på variabeln beror på dess bidrag till modellen. Variabler som är positivt korrelerade med en principalkomponent är på samma sida som principalkomponenten i koordinatsystemet. Variabler som är negativt korrelerade med en principalkomponent är på motsatt sida i koordinatsystemet jämfört med principalkomponenten. Resultatet gav att alla variabler är negativt korrelerade med principalkomponent 2. Vindboxar med låga nummer, alla variabler i gratevagnen och tid är negativt korrelerade med principalkomponent 1.

Figur 6.​ Loadings för alla variabler, där färgen beror på variabelns bidrag till modellen. I figur 7 plottas variablernas cos​2​ värden i en korrelationscirkel. Ju närmare

korrelationscirkel, det vill säga den yttre cirkeln, en variabel befinner sig, desto bättre är den representerad av motsvarande principalkomponent. Variablernas position i koordinatsystemet anger korrelationen mellan variabel och principalkomponent på samma sätt som i figur 6. Variabler med låga cos​2​-värden har svart färg, variabler med medelhöga cos​2​ värden blå färg och variabler med höga cos​2​-värden röd färg. Utmärkande i figur 7 är variablerna TC1, TC2, TC3, TC4 och tid. Samtliga av dessa variabler är nära origo och har därmed låga cos​2-​värden vilket innebär att de inte är väl representerade av varken principalkomponent 1 eller 2.

Figur 7.​ Cos​2​ värden för samtliga variabler där färgen beror på cos²-värdet. Funktionen ​dimdesc​ i R gav för principalkomponent 1 signifikanta p-värden för samtliga variabler. Resultatet är därmed att samtliga variabler är signifikant korrelerade till

principalkomponent 1. För komponent 2 hade samtliga variabler utom Vindbox_18 och TC4 signifikanta p-värden. De lägsta p-värdena för både dimension 1 och 2 tillhör variablerna i vindboxarna. Fullständigt resultat av ​dimdesc​ för principalkomponent 1 och

principalkomponent 2 finns i bilaga B.

6.2 Resultat för PLS

En PLS-modell med som förklaringsvariabler och X Y som responsvariabler skapades med korsvalidering. Resultatet av korsvalidering gav en modell med 2 komponenter. Resultatet för den varians hos Y som modellen förklarar ges i tabell 3 nedan. Den förklarade variansen är ytterst låg för samtliga responsvariabler. Den förklarade variansen är lägre än 2 % för samtliga responsvariabler.

Tabell 3. ​Förklarade varians (%) för responsvariablerna i PLS-modellen med somX förklaringsvariabler och Y som responsvariabler. Värdena under “2 komponenten” är de

kumulativa värdena för den förklarade variansen.

RMSEP-värdet beräknat med CV och CV​adj​ plottades för respektive responsvariabel vilket presenteras i figur 8. RMSEP värdet för TC1 sjunker inte lika snabbt som för övriga responsvariabler, som har en skarp lutning i sina kurvor från 0 till 1 komponent. Värdet på RMSEP är dock mycket lägre för TC1 än för TC2, TC3 och TC4. RMSEP värdena är så särskiljande från TC1 jämfört med övriga att det indikerar på att något är fel. Det lägsta RMSEP värdet för såväl TC1 som TC2 ges vid 2 komponenter. För TC3 och TC4 ges det lägsta värdet på RMSEP av en komponent. Skillnaden mellan 1 och 2 komponenter är dock väldigt liten för både TC3 och TC4. Resultatet av figur 8 är att modellen ska baseras på två komponenter vilket stämmer överens med resultatet som gavs av korsvalidering.

Figur 8.​ RMSEP värden för variablerna i PLS modellen med X som förklaringsvariablerY och Y som responsvariabler.

I figur 9 presenteras plottar för modellens scores och loadings, dels för och X Y separat och dels för och X Y tillsammans. Plotten längst upp till vänster visar scores och loadings för

De röda markeringarna motsvarar variablerna VB och VB_lag1 och de svarta .

X

markeringarna motsvarar observationer. I denna plot visas komponenterna, som ges av förklaringsvariablernas loadings. Komponenterna ges av,

Komponent 1: − 0.518* VB − 0.874* VB_lag1 Komponent 2: 0.938* VB − 0.384* VB_lag1

Figur 9 visar att TC1 har ett loadingvärde på i det närmaste 0 för såväl komponent 1 som komponent 2. Det innebär att ingen av komponenterna innehåller information från TC1, utan de baseras på TC2, TC3 och TC4. Från plotten går det att utläsa att det finns en spridning bland observationerna. De flesta observationer befinner sig där det är mycket svart i plotten vilket motsvarar ett scorevärde mellan ungefär -1.8 och 0.2. Det finns dock en spridning i datat, till exempel har observation 257 ett scorevärde på ungefär 5.7 och observation 17 ett

scorevärde på ungefär -4.5, båda för komponent 2. Observation 17 har dessutom ett scorevärde på nästan -8 för komponent 1, vilket är utmärkande jämfört med övriga observationers scorevärden för komponent 1.

Figur 9.​ Scores- och loadingsplottar för PLS modell med som förklaringsvariabler och X Y som responsvariabler.

För modellen plottades observerade värden mot predikterade värden för respektive

förklaringsvariabel. Resultatet visas nedan i figur 10, där observerat värde finns på x-axeln och predikterat värde finns på y-axeln av grafen. De predikterade värdena följer inte den räta linjen. De predikterade värdena har samma mönster för alla variabler. Resultatet visar att TC1 utmärker sig genom att både ha predikterade och observerade värden som är lägre än övriga responsvariablers. Plottarna för TC3 och TC4 ser tämligen lika ut, medan TC2 har såväl predikterade som observerade värden med lägre värden, men fortfarande betydligt högre än de för TC1. Resultatet av figur 10 är att modellen inte gör bra prediktioner av

Figur 10.​ Plottar över observerade värden och predikterade värden för modellen med somX förklaringsvariabler och Y som responsvariabler.

Med anledning av att den framtagna modellen inte var bra på att förklara Y med hjälp av ,X så skapades ytterligare en PLS modell. På grund av att TC1 urskiljde sig så mycket från övriga variabler och inte ingår i någon komponent så beslutades att inte ha med TC1 i den andra modellen. Den outlier, observation 17, som hittades vid analysen av den första modellen uteslöts också i den andra modellen. Den andra modellen skapades således utan observation 17 och med Ynew bestående av TC2, TC3 och TC4 som responsvariabler och ,X oförändrad, som förklaringsvariabler.

Resultatet av andel förklarad varians för responsvariablerna var väldigt låg även i den andra modellen. TC2 hade något lägre andel förklarad varians medan TC3 och TC4 hade något

högre andel förklarad varians jämfört med den första modellen. Dessa skillnader var dock så små att de var försumbara.

Figur 11 visar att det lägsta RMSEP-värdet för samtliga responsvariabler i den andra modellen gavs vid 2 komponenter. TC2 hade det lägsta RMSEP-värdet av

responsvariablerna. Enligt figur 13 bör modellen innehålla två komponenter, vilket stämmer överens med resultatet som gavs vid korsvalidering.

Figur 11.​ RMSEP värden för TC2, TC3 och TC4 i den andra PLS modellen, med somX förklaringsvariabler och Ynew som responsvariabler​.

På samma sätt som för den första modellen, så plottades observerade värden mot predikterade värden för respektive responsvariabel. Resultatet var jämförbart med det för den första

modellen, som visas grafiskt i figur 10, med stora skillnader mellan predikterade- och observerade värden. Det var endast små skillnader mellan komponenterna i den andra modellen jämfört med den första modellen. Komponenterna som visas grafiskt i figur 12 i plotten längst upp till vänster, ser ut som följer,

Komponent 1: − 0.545* VB − 0.864* VB_lag1 Komponent 2: 0.937* VB − 0.384* VB_lag1

Vidare visar plottarna i figur 12 på en spridning i datamaterialet eftersom observationerna inte är samlade i plotten. Ytterligare ett resultat är att TC3 och TC4 har snarlika loading- och scorevärden. TC2 avviker något från dem genom att ha ett lägre loadingvärde, ungefär 10 för komponent 1 och ett något högre loadingvärde, ungefär 7 för komponent 2.

​Figur 12.​ Scores- och loadingplottar för den andra PLS modellen, med somX förklaringsvariabler och Ynew som responsvariabler​.

6.3 Övrig analys

I figur 13 presenteras resultatet från att observationer från TC1, TC2, TC3 och TC4 plottats. Den blåfärgade, horisontella linje som finns i varje plot representerar den givna variabelns medelvärde för de plottade observationerna. Resultatet från TC1 skiljde sig helt från övriga variabler. Medelvärdet för TC2 var något lägre än för TC3 och TC4, varav de två senare var ytterst lika i såväl medeltemperatur som spridning mellan låga och höga temperaturvärden.

Figur 13. ​Observerade värden för TC1, TC2, TC3 och TC3 plottade. Den blåa linjen representerar medelvärdet av de plottade observationerna, för respektive variabel.

Slutligen så plottades TC1, TC2, TC3, TC4, VB_lag1 och VB mot varandra vilket presenteras i figur 14. Varje punkt motsvarar ett observationspar och det plottas för

respektive variabel. Resultatet var ekvivalent med det som framkommit hittills i uppsatsen, TC1, TC2, TC3 och TC4 kan inte förklaras av VB_lag1 och VB med det datamaterial som analysen baseras på. Plottarna i figur 14 visar ett linjärt samband mellan TC3 och TC4. TC2 uppvisar tendenser till samband med TC3 och TC4, men det är inte ett perfekt samband eftersom det finns ett utstickande mönster för låga värden på TC3 och TC4, som inte ger motsvarande låga värden på TC2. Det går att se en trend mellan VB_lag1 och VB också, framförallt för temperaturvärden upp till ungefär 350 grader för VB. VB_lag1 och VB ökar dock inte i samma takt som VB. Mellan TC1, TC2, TC3 och TC4 samt VB_lag1 och VB går det inte att se något samband. Punkterna ligger någorlunda slumpmässigt utspridda, med vissa undantag för grupperingar, men utan linjära mönster i plottarna vilket säger att det inte finns något samband.

Figur 14.​ Pairs matrix för variablerna i och .X Y

6.4 Resultat för multivariat regressionsmodell

Resultatet för den multivariata regressionsmodellen med Y som responsvariabler och X som förklaringsvariabler gav för responsvariabeln TC2 ett signifikant p-värde för VB_lag1. I övrigt var förklaringsvariablerna inte signifikanta för någon av responsvariablerna. Resultatet från MANOVA resulterade i icke signifikanta p-värden för både VB_lag1 och VB. Resultatet från testet innebär att H​0​, att VB_lag1 och VB inte har effekt på någon av responsvariablerna, behålls. Kontroll av modellantaganden visade att dessa inte var helt uppfyllda, till exempel såg residualerna i Normal Q-Q plot inte ut att vara normalfördelade.

7. Diskussion

Förädlingsprocessen av järnmalm för att skapa pelletskulor är ytterst komplex och beror på många faktorer, där temperaturer är en. Att modellera en sådan process är därmed svår och svårigheten blir extra påtaglig när en ny metod ska undersökas vilket har varit fallet i mitt arbete. Analysen av temperaturdata från vindboxar och gratevagn har bidragit med mycket information, även om de modeller som har tagits fram för att förklara temperaturer i ett mätsystem, med ett annat mätsystem, inte har lyckats med sitt syfte. PLS modellerna med vindbox- och laggad vindbox data som förklaringsvariabler och gratevagnens mätpunkter som responsvariabler kunde inte prediktera temperaturvärden i gratevagnen och den förklarade variansen för responsvariablerna var ytterst låg. Det finns flera tänkbara anledningar till att PLS modellerna inte fungerade för att varken förutse eller förklara

gratevagnens temperaturmätningar. Den mest intuitiva anledningen ur en statistisk synvinkel kan tänkas vara att temperaturerna från vindboxarna inte har något samband med

gratevagnens temperaturer och därmed inte kan användas som förklaringsvariabler i en modell för att förklara gratevagnens temperaturer. Denna förklaring verkar dock inte särskilt trolig då det är gasen i vindboxarna som styr temperaturen i pelletsugnen. Den nämnda anledningen stöds inte heller av sakkunniga på LKAB som menar att det är ytterst otänkbart att vindboxarna inte har något samband alls med gratevagnen. Med denna bakgrund

föreligger ett antal andra förklaringar som anses vara mer sannolika till att PLS-modellerna inte uppfyller det tänkta syftet. Den kanske troligaste förklaringen kan vara att hastigheten för gratevagnen har varit för generell. Hastigheten har beräknats som ett genomsnitt av

hastigheten under de dagar som analysen baseras på. Hastigheten har använts för att beräkna gratevagnens position i pelletsugnen och därmed i förhållande till vindboxarna. På grund av olika anledningar så varierar gratevagnens hastighet. Den temperaturdata som studien baseras på har valts utifrån kriteriet att uppehåll i produktionen, det vill säga stillastående

gratevagnar, inte fick förekomma. Den genomsnittliga hastigheten som använts för att beräkna gratevagnens position kan trots detta ha varit för generell för att matcha ihop

gratevagn och vindboxar på ett optimalt sätt. Om detta har skett så behöver inte den position som gratevagnen beräknats vara vid en vindbox vara korrekt. Det skulle i sådana fall kunna vara orsaken till att vindbox och laggad vindbox i princip inte alls förklarar någon variation

hos TC1, TC2, TC3 och TC4. Detta är därmed en tänkbar och mer sannolik anledning till resultatet för PLS-modellerna.

Ytterligare en tänkbar förklaring till att PLS-modellerna inte lyckades med sitt ändamål hade kunnat vara TC1, som var helt annorlunda än resterande tre variabler på gratevagnen. Med anledning av detta skapades en ny PLS-modell som inte skiljde sig nämnvärt från den första modellen. Resultatet avvisar att TC1 skulle vara orsaken till PLS-modellernas obefintliga förmåga att förklara temperaturer i gratevagnen. En slutsats av detta är däremot att TC1 bör undersökas av LKAB då detta mätinstrument med all sannolikhet inte fungerar korrekt.

Som tidigare nämnt gav analysen information som är viktig och som bör tillgodogöras av LKAB. Sakkunniga på LKAB menar att det är viktigt att temperaturfördelningen över bädden på gratevagnen är jämn. Detta för att dels producera en produkt som håller en jämn och hög kvalitet och dels för att undvika ojämnt slitage på utrustning i pelletsugnen. Analysen av gratevagnens variabler, som alltså visade att TC1 inte fungerar korrekt, visade även tendenser på att värmespridningen inte är jämn över gratevagnens bädd. Två av variablerna, TC3 och TC4, var väldigt lika varandra vilket innebär att temperaturen är jämn mellan de två

mätpunkterna. Jämfört med dessa två var TC2 annorlunda på ett sätt som inte talar för att temperaturen är jämn över hela gratevagnen vilket bör undersökas vidare av LKAB.

Den multivariata regressionsmodell som skapades kunde inte heller förklara Y med hjälp av . Det kan vara en indikation på att problemet inte huvudsakligen ligger i modellval, utan X

kanske snarare beror på någon annan anledning, eventuellt någon av de förklarat i den initierande delen av detta avsnitt. Något som inte kan bortses ifrån är dock att den

multivariata regressionsmodellen inte fullt uppfyller de grundläggande antaganden som finns för såväl modellen som den använda teststatistikan Wilks lambda. Resultaten från modellen blir på grund av icke uppfyllda antagandena därför varken tillfredsställande i syfte att skaX förklara Y eller i syfte att skapa tillförlitliga resultat. Det bör därför tas i beaktning och kan vara en förklaring till att den multivariata regressionsmodellen inte fungerade som önskat, även om det nog ligger närmare till hands att tro, som tidigare nämnt, att det inte var

att inte heller PCA eller PLS modellerna kom helt till sin rätt i studien. Visserligen hade datamaterialet många observationer, men med endast två förklaringsvariabler och fyra responsvariabler blev inte modellernas förmåga att hantera flera variabler utnyttjad till sin fulla potential.

7.1 Företagsnytta och vidare studier

Rekommendationen till LKAB är att se över mätinstrumentet TC1 på gratevagnen då det inte fungerar korrekt. Förhoppningen att denna uppsats ska vara ett underlag för LKAB i

ytterligare forskning på området. Vidare forskning på de frågor som har aktualiserats i denna uppsats skulle behövas. Nya studier skulle kunna fastställa om och hur mätsystemen faktiskt samverkar med varandra. För att underlätta vidare studier rekommenderas starkt att bygga ut mätsystemet med en funktion som identifierar gratevagnens positionen i pelletsugnen. Den tidsstämpel som finns idag ger visserligen information om klockslag, men information om gratevagnens position framkommer inte. Att identifiera gratevagnens position med hjälp av hastighet och tid innebär tidskrävande beräkningar. Min studie indikerar på att det blir en för stor osäkerhet och felmarginal på gratevagnens position av att beräkna den med hjälp av en genomsnittshastighet, vilket kan antas bero på att gratevagnen inte rör sig i en konstant hastighet. Trots att det datamaterial som använts har valts utifrån att hastigheten för

gratevagnen inte ska ha varit avvikande åt varken extremt låg eller extremt hög, så tyder det på att identifieringen av gratevagnen med genomsnittshastigheten inte har varit felfri. Att beräkna gratevagnens position med genomsnittshastigheten för betydligt kortare sekvenser hade varit önskvärt, men det var tyvärr inte möjligt på grund av den tidsbegränsning detta arbete haft. Det tidskrävande arbetet ligger inte bara i att beräkna hastigheten för många sekvenser i ett stort datamaterial, utan också och kanske framförallt i den efterföljande statistiska analysen. En större datamängd och en större skillnad i hastighet inom

datamaterialet skulle innebära ännu större problem med detta. Det skulle därför ge såväl tidsvinning som betydligt säkrare analyser att ha en positionsstämpel på gratevagnen. Jag rekommenderar därför starkt att LKAB bör se över möjligheten med positionsstämpel.

Jag tycker att det nyutvecklade mätsystemet är ett exceptionellt verktyg för LKAB i deras pelletsproduktion eftersom det ger temperaturdata genom hela pelletsugnen. Det ger otroligt

mycket data och möjligtvis finns ett behov av att strukturera upp datamaterialet på ett sätt som gör det mer tolkningsbart men också lättillgängligt. Vidare studier av mätsystemet skulle dock behövas för att kunna använda det nyutvecklade mätsystemet på bästa sätt och därmed utnyttja dess fulla potential. Framtida studier kan genomföras på liknande sätt, men då måste säkerheten för gratevagnens position måste vara större. Annars är ett annat alternativ för vidare studier att endast undersöka gratevagnen, då det avlägsnar problemet med att matcha ihop vindboxar och gratevagn. Då kan det dock föreligga ett behov av att utöka antalet

mätpunkter på gratevagnen. Det vore också intressant att undersöka ett större datamaterial, då storleken på mitt datamaterial begränsades av datorkapacitet och fler laggar. I min studie undersöks endast en, men det kan finnas en fördröjning innan det som sker i en vindbox visar sig på gratevagnen vilket framtida studier bör undersöka. Vidare studier där fler variabler tas med i studien vore också väldigt intressant.

Jag kan konstatera att mer forskning behövs för att undersöka om de tendenser till en

värmespridning över gratevagnen som inte är jämn, som jag såg i min studie stämmer. Detta anser jag är viktigt att undersöka för LKAB. En jämn värmespridning är enligt tidigare forskning eftersträvansvärd då det bidrar till en jämn produktkvalitet och mindre slitage på utrustning i pelletsugnen. Att tendenser i denna studier tyder på att så inte är fallet i LKAB:s pelletsverk MK3 i Malmberget betyder att det finns möjligheter till såväl kostnadsbesparing som högre och jämnare produktkvalitet. En fullständig förståelse för det nyutvecklade mätsystemet skulle kunna medföra att det kan användas som ett verktyg för LKAB i styrningen av pelletsugnen. I dagsläget styrs pelletsugnen av resultat från pelletskulor som redan har gått igenom pelletsugnen. Det nyutvecklade mätsystemet, med kontinuerlig

temperaturmätning borde kunna utnyttjas så att pelletsugnen kan styras i realtid och på så sätt åtgärda eventuella problem innan de uppkommer. Det skulle kunna ge ökad produktion och energibesparingar. Avslutningsvis är min förhoppning att denna studie ska vara ett första steg till vidare studier och att LKAB ska ha användning av resultaten som kommit fram i studien.

8. Referenslista

Andersen, Ib. (1998). ​Den uppenbara verkligheten: val av samhällsvetenskaplig metod​. Lund: Studentlitteratur.

Byron, Frederick W. & Fuller, Robert W. (1970). ​Mathematics of classical and quantum

Related documents