• No results found

Multivariat analys av sammanst¨ alld data

Vid den f¨orsta workshop som h¨olls i samr˚ad med projektgruppen analyserades all r˚adata f¨or att skapa en generell uppfattning av regelbundenheter och egenskaper i datasetet, likt det tillv¨agag˚angss¨att som beskrivs i (Eriksson m. fl. 2001). Till denna analys togs normalf¨ordelningsplottar fram ¨over alla parametrar i datasetet. P˚a s˚a s¨att kunde en enkel ¨overblick av f¨ordelningen f¨or datapunkterna f˚as och ¨aven uppt¨acka om det var n˚agon punkt som avvek j¨amf¨ort med majoriteten. Utifr˚an denna analys uppt¨acktes ett antal uteliggare som avvek s˚a pass mycket att de inte kunde klassas som variation. Dessa punkter analyserades vidare f¨or att f˚a en f¨orst˚aelse f¨or vad de berodde p˚a och det visade sig att det i dessa fall hade blivit fel i m¨atverket vilket f¨orekommer d˚a och d˚a. Punkterna togs bort eftersom att risken annars skulle vara att resultatet av PCA och PLS analyserna i sin tur skulle bli missvisande. I samband med detta uppt¨acktes det ¨aven att viss data sakna-des f¨or ett f˚atal batcher. Detta berodde till viss del p˚a buggar i MES/EPI men ¨aven p˚a manuella justeringar som genomf¨orts av operat¨orerna. Vid de tillf¨allen som en justering genomf¨orts av en operat¨or skrevs ¨aven en notering och denna analyserades utifr˚an den historiska data som fanns tillg¨anglig f¨or batcherna. Utif˚an kommentarerna justerades den data som fanns i datasetet.

Under denna inledande analys uppt¨acktes ett stort fel g¨allande den doseringsm¨angd som hade registrerats i MES f¨or ett antal batcher som g˚att p˚a produktionslina D. Vid doseringen hade enbart ett av tv˚a v¨arden registrerats vilket medf¨orde att det saknades en m¨angd som m¨atte i storleksordning hundratal. En vidare analys av detta visade att det p˚ag˚att sedan december 2018. Anledningen till att det inte m¨arkts f¨orr¨an nu berodde p˚a att operat¨orerna doserade utifr˚an ett torrt v¨arde medan det v¨arde som presenterades i MES var ett v˚att v¨arde. Utifr˚an det torra v¨ardet ber¨aknas den v˚ata m¨angden automatiskt via systemet. Det torra

v¨ardet ¨andrades enbart om en st¨orre korrigering g¨allande KP beh¨ovde g¨oras. Vid s˚adana f¨or¨andringar skrev operat¨oren en notering som registrerades i MES. Utifr˚an detta analyserades samtliga batcher fr˚an december fram tills dess att provperioden avslutades och det visade sig att ingen ¨andring gjorts under denna period. D¨arf¨or kunde dessa v¨arden ans¨attas till det som tidigare torra m¨angder ber¨aknats om till och p˚a s˚a s¨att inte ge missvisande resultat i den multivariata analysen.

Till och b¨orja med analyserades skillnaden mellan produktionslinorna. Eftersom att dessa ¨ar byggda un-der olika ˚artal och utifr˚an olika f¨oruts¨attningar i fabriken finns vissa skillnader mellan dessa. Hur stort utslag detta ger st¨alldes upp i ett s˚a kallat Anova test. Testet bygger p˚a att analysera variansen och medelv¨ardet i KP f¨or de olika linorna. Utfallet av testet kan ses i Figur 51.

Figur 51: Anovatest f¨or att avg¨ora ifall skillnad i varians och medelv¨arde var n¨arvarande mellan produktions-linorna.

Genom att ringarna till h¨oger i bild sammanfaller tyder det p˚a att ingen skillnad finns g¨allande varian-sen och medelv¨ardet ¨over linorna.

De parametrar som sedan tidigare ans˚ags ha st¨orst p˚averkan p˚a KP analyserades envariabelt i SIMCA likt den analys som presenterades tidigare i detta avsnitt. Styrparametrarna som operat¨orerna i huvudsak ¨

andrade om variation uppstod i processen st¨alldes upp mot KP. Till dessa h¨orde parameter B och C som tidigare har ifr˚agasatts ifall dessa ger minskad variation eller f¨orv¨arrar variationen. Doseringen av parameter C kan ses i Figur 52.

Figur 52: Envariabelsanalys av m¨angden parameter C mot utfall i KP.

I deth¨ar fallet visade sig P-v¨ardet vara mindre ¨an 0,05 vilket ¨ar gr¨ansen f¨or att nollhypotesen ska f¨orkastas. Med nollhypotesen menas att lutningen p˚a den linje som presenteras i bilden ¨ar noll och att ett steg i sidled inte medf¨or n˚agon f¨or¨andring i y-v¨ardet. I deth¨ar fallet kan kan en negativ lutning urskiljas vilket visar att en st¨orre m¨angd av parametern C medf¨or mindre KP vilket st¨ammer ¨overens med teorin och verkligheten. N¨ar R2 l˚ag tydde det p˚a att m¨angden av parametern C representerade en mycket liten del av variationen i KP.

Parameter B f¨or samtliga produktionslinor analyserades p˚a samma s¨att som parameter C f¨or att se hur denna f¨orh¨oll sig mot nollhypotesen d¨ar resultatet f¨or produktionslina B kan ses i Figur 53.

Figur 53: Envariabelsanalys av f¨or¨andring i parameter B mot f¨or¨andring i KP.

¨

Aven h¨ar var P-v¨ardet mindre ¨an 0,05 och nollhypotesen kunde f¨orkastas och den negativa lutningen p˚a linjen tyder p˚a att KP minskar n¨ar parametern B ¨okade. Dock var R2 v¨ardet ¨aven h¨ar mycket l˚agt vilket tyder p˚a att parameter B beskriver en mycket liten del av variationen i KP. Anledningen till det l˚aga v¨ardet berodde p˚a att n¨armare h¨alften av m¨atpunkterna varierade fast¨an att parameter B inte ¨andrades. Det tyder, som tidigare konstaterat, att n˚agon annan variation var n¨arvarande. N¨ar det ¨and˚a fanns en viss korrelation mellan parameter B och KP genomf¨ordes en Anova analys. Till testet klassades f¨or¨andringen in i en ¨okning, minskning eller ingen f¨or¨andring. I Figur 54 kan resultatet av detta urskiljas.

Figur 54: F¨or¨andring i parameter B och dess utfall av KP i ett Anova-test.

Variansen f¨or de tre indelningarna ¨ar inte lika men medelv¨ardet f¨or en ¨okning och minskning ¨ar ˚atminstone skilt fr˚an varandra d¨ar en ¨okning ger mindre KP och minskning st¨orre KP. Det kan ¨aven utl¨asas att varia-tionen f¨or KP ¨ar mycket stor utan n˚agon f¨or¨andring. Fr˚agan ¨ar d˚a vad detta beror p˚a, d¨ar vissa f¨oraningar kan riktas mot r˚avarorna.

N¨ar ovanst˚aende enbart behandlade tv˚a av totalt 68 variabler fortsatte arbetet med att analysera hela da-tasetet. N¨ar detta arbete var iterativt d¨ar en modell skapades f¨or att sedan plocka bort variabler som inte hade n˚agon signifikant p˚averkan p˚a KP skulle det bli allt f¨or omfattande att avhandla exakt alla steg som gjordes i analysen. D¨arf¨or kommer enbart de mest relevanta analysdelarna som kan kopplas till ett slutgiltigt resultat att presenterat i f¨oljande stycken. I denna analys valdes det att fokusera p˚a den modell som beskrevs av koefficient 1 eftersom att denna beskrev KP p˚a b¨ast s¨att. De fall d¨ar modellen uppvisade flera koefficienter unders¨oktes dessa ¨oversiktligt f¨or att se om de gav n˚agon ytterligare information ¨an modellen med koefficient 1. Dessa koefficienter beskrevs av tv˚a staplar som illustrerade R2Y v¨ardet och Q2 v¨ardet f¨or modellen. R2Y beskrev andelen som KP f¨orklarades av modellen medan Q2 beskrev hur v¨al modellen predikterade utfallet. Ju h¨ogre dessa var samtidigt som differens mellan de minskade desto b¨attre beskrevs KP utifr˚an det dataset som togs med i modellen. Ett exempel p˚a hur detta analyserades i SIMCa illustreras i Figur 55 d¨ar b˚ade R2Y v¨ardet, Q2 v¨ardet och skillnaden mellan dessa kan urskiljas.

Figur 55: Koefficienterna f¨or en godtycklig modell med dess R2Y och Q2 v¨arde.

Den modell som till en b¨orjan tog h¨ansyn till samtliga 68 variabler och 506 batcher gav ett resultat d¨ar ett stort antal variabler inte hade n˚agon signifikant p˚averkan p˚a KP. Utifr˚an den kunskap som processingenj¨or, forskningsingenj¨or och kvalitetsansvarig kunde ett stort antal variabler s˚allas bort. Detta genom att koppla den bakomliggande teorin i processen till modellen. N¨ar antalet variabler reducerades uppt¨acktes ytterligare ett problem. N¨ar det enbart var 22 batcher av 506 som hade analyserats ytterligare medf¨orde det att dessa v¨arden inte blev representativa i en analys d¨ar samtliga 506 batcher togs med. Av denna anledning valdes det att prim¨art unders¨oka modeller inneh˚allande de 22 batcher som det tagits extra prover p˚a under mars m˚anad. Genom att iterativt arbeta med den modell som byggde p˚a provperiodens batcher kunde det tillslut konsta-teras att de variabler som hade starkast signifikans mot KP var parameter B och C samt leveranserna av RV1 och RV2 tillsammans med ett f˚atal andra variabler. RV1 hade i deth¨ar fallet st¨orst p˚averkan p˚a KP av de tre r˚avarona som anv¨andes vilket ocks˚a var logiskt eftersom att det doserades en st¨orre m¨angd av denna j¨amf¨ort med RV2 och RV3. F¨or att unders¨oka detta vidare sammanst¨alldes de v¨arden som presenterades i analyscertifikaten f¨or RV1 och RV2. Det visade sig att RV1 k¨optes fr˚an tv˚a olika leverant¨orer som valde att presentera sina analyscertifikat p˚a olika s¨att. Sammanst¨allningen f¨or b˚ada r˚avarorna presenteras i Bilaga I. Som det kan urskiljas finns n¨astan ingen variation n¨arvarande i analyscertifikatet f¨or RV2 och d¨arf¨or utsel¨ots denna. G¨allande RV1 d¨aremot fanns en viss variation och d¨arf¨or f¨ordes dessa v¨arden ¨over till Simca f¨or att m¨ojligg¨ora vidare analys av hur inneh˚allet i RV1 p˚averkade KP. I denna modell kunde det urskiljas att pH v¨ardet i RV1 p˚averkade utfallet av KP, se Figur 56.

Figur 56: PLS-modellering med h¨ansyn till de 22 batcher som analyserades under provperioden.

Ut¨over detta kunde det ¨aven urskiljas att parameter C var signifikant negativ mot KP eftersom att stapeln och spridningen f¨orh˚aller sig under 0. Det som avg¨or om en variabel har en signifikant p˚averkan eller ej beror p˚a hur stor stapeln ¨ar och om majoriteten av spridningen f¨orh˚aller sig p˚a samma sida av 0 som stapeln. ¨Aven PBVR2 1 och PBVR1 3 f¨oreh¨olls sig signifikant negativt mot KP. Detta tyder p˚a att ¨aven i en multivariat analys f¨orh˚aller sig parameter B och C p˚a r¨att s¨att med h¨ansyn till teorin och utfallen i processen. Ut¨over detta kan som ovan n¨amnt ¨aven pH v¨ardet i RV1 f¨orh˚alla sig signifikant negativ mot KP vilket ¨ar intressant f¨or vidare analys. Omr¨orareffekt 3 f¨or K1 visade sig inte vara signifikant i denna modell och togs d¨arf¨or inte i ˚atanke. De ¨ovriga staplarna vars v¨arden inte visas ans˚ags inte vara intressanta utifr˚an dess p˚averkan rent teoretiskt.

Utifr˚an den envariabla och multivariabla analysen kunde det konstateras att b˚ade parameter B och C f¨orh¨oll sig likt teorin. D¨arf¨or var det av intresse att se hur variationen mellan batcherna f¨orh¨oll sig n¨ar dessa h¨olls konstant. Som tur var hade totalt 12 batcher p˚a produktionslina C inte ¨andrat varken n˚agon av dessa under provperioden. Batcherna valdes ut och en ny modell i SIMCA togs fram d¨ar fokusomr˚adet var att analysera vilka ¨ovriga parametrar som varierade vilket resulterade i modellen som kan ses i Figur 57

Figur 57: PLS-modellering f¨or provperioden med konstant v¨arde f¨or parameter B och C.

Det kunde tydligt avl¨asas att parametern P1 och P3 som togs fram specifikt f¨or provperioden var negativt respektive positivt signifikant f¨or KP. ¨Aven temperaturen p˚a processvattnet hade en negativt riktat signi-fikans vilket kom att analyseras vidare eftersom att denna parameter enligt teorin inte skulle p˚averka KP mycket. Det som visade sig vara ytterst intressant var att i denna modell uppvisade leverans tre och fyra av RV3 p˚averka KP b˚ade positivt och negativt. ¨Aven pH v¨ardet var fortsatt signifikant tillsammans med omr¨orareffekten f¨or K2. Utifr˚an denna modell eliminerades de variabler som inte var signifikanta f¨or att ytterligare f¨orb¨attra R2Y och Q2 v¨ardet i modellen. Det resulterade i en modell som byggde p˚a tv˚a olika koefficienter. Dessa presenteras i Figur 58

Figur 58: Den slutgiltiga modellen som p˚avisar viss signifikans i 11 olika variabler.

¨

Aven h¨ar kan P1 fr˚an testperioden, leverans tre och fyra av RV3, pH v¨ardet fr˚an RV1 och omr¨orareffektet f¨or K2 ses som antingen positivt eller negativt signifikant om h¨ansyn till koefficient 1 tas, ¨overst i figuren ovan.

Denna modell ans˚ags vara tillr¨ackligt representativ f¨or att basera framtida slutsatser p˚a n¨ar R2Y v¨ardet samt Q2 v¨ardet var relativt h¨ogt, se Figur 59

Figur 59: V¨ardet f¨or R2Y och Q2 tillh¨orande modellen som beskrivs ovan.