• No results found

3. Metod

3.5 Utvärdering

3.5.1 Los Angeles och micro Deval

Tabell 5. Problem och lösningar för brister i fotografier.

Problem Lösning Bild på lösning

Överlappande korn (ingen rand kan urskiljas)

Båda kornen raderas från bilden

Överlappande korn (ett korns rand kan urskiljas)

I fallet med det nedre kornet kan formen urskiljas från kornet under pga. färgskillnad. Då kan randen på detta korn tas ram och det mörkare kornet raderas helt från bilden.

Korn nära varandra

Tydliggöra gränsen mellan korn genom att ”sudda” en gräns mellan kornen. Detta kan endast göras om kornets form påverkas minimalt.

En smal brygga har skapats mellan kornen.

Korn som överlappar skalan.

Sudda ut skalan.

3.5 Utvärdering

3.5.1 Los Angeles och micro Deval

Data från bildanalysen var först separerat för varje fotografi. Sedan lades fotografierna från samma prov ihop och sorterades i före- och efterdata. I programmet MATLAB analyserades data från bildanalysen för att finna statistiska fördelningar till varje variabel som analyserades: area, aspect

ratio, cirkularitet, Ferets diameter, Ferets minsta diameter, roundness och soliditet. Dessa variabler

valdes för att de beskriver kornens form och storlek, vilket är intressant att studera. Med hjälp av verktyget ”Distribution Fitting Tool” utvärderas varje storhets fördelning genom att okulärt bestämma den bästa matchningen till olika kända fördelningar. Detta gjordes för att kunna sammanfatta

datasamlingar och kunna jämföra datasamlingar. För att kunna göra jämförelser mellan före- och efterdata och mellan Los Angeles och micro Deval krävdes att en och samma variabel i de olika grupperingarna hade samma fördelning.

32

Sambandet mellan olika variabler är också intressant att utreda. Det kan tänkas vara möjligt att det finns samband mellan hur formstorheterna varierar med varandra. Det kan även finnas samband mellan arean på kornen och deras form, antingen för att mindre korn är mer nötta och därmed rundare eller för att mindre korn är fragmenterade och mer kantiga. För att undersöka samband används multivariabelanalys, närmare bestämt faktoranalys. Faktoranalys är ett sätt att undersöka om flera oberoende variabler kan kombineras i ett färre antal faktorer för att lättare beskriva datamaterialet.

MATLAB användes för att utföra faktoranalysen. Vektorn x består av variabler och detta är indatat till faktoranalysen. Med hjälp av maximum likelihood-metoden beräknas i Formel 25 vektorn µ, som består av konstanta medelvärden; vektorn f, som består av oberoende, standardiserade faktorer; matrisen Λ, som består av faktorernas laddningar; och vektorn e, som består av oberoende feltermer (MathWorks, 2014).

Formel 25

Det finns fyra krav på datamaterialet för att kunna utföra en multivariat analys; normalitet, homoskedasticitet, linjäritet och avsaknad av korrelerade avvikelser. Det viktigaste kravet är att datamaterialet är normalfördelat, särskilt för små datasamlingar. För samlingar med fler än 200 datapunkter försvinner i princip den negativa effekten av icke-normalitet. För faktoranalys är det enskilt viktigaste kravet normalitet, där de tre andra kraven inte har särskilt stor påverkan (Hair et al., 2010).

Nedan följer en stegvis genomgång av faktoranalys i MATLAB från Hair et al. (2010).

Steg 1 är att presentera variablernas korrelationer i en korrelationsmatris. Om en variabel inte har någon signifikant korrelation innebär detta att den inte kan ingå i en faktor tillsammans med en annan variabel. Gränsen för vad som är signifikant beror av hur stort underlaget är, alltså hur många korn som har analyserats. Om en variabel inte har någon signifikant korrelation tas den bort från faktoranalysen och en ny korrelationsmatris beräknas. En korrelationsmatris för matrisen X, med variablerna som kolonnvektorer, tas fram i MATLAB med kommandot corrcoef(X).

Steg 2 är att bestämma hur många faktorer, m, som ska tas fram. Korrelationsmatrisen, R, har

egenvärden som tas fram med MATLAB-kommandot eig(R), se Tabell 6. Egenvärdeskriteriet säger att

m bestäms som det antal egenvärden som har värde större än ett. För datat i Tabell 6 blir det alltså

fyra. Tabell 6 visar att fyra faktorer beskriver 94,63 % av datasamlingens variation. Ett annat sätt att bestämma m är med en scree plot, se Figur 29. Y-axeln presenterar egenvärdet och x-axeln består av faktortalet från Tabell 6. Det värde där grafen gör en böj (eng. elbow) bestäms till m. Om de två metoderna ger olika värden på m bör det högre värdet väljas. Skulle det visa sig att det inte är relevant med det högre antalet faktorer kommer det att visa sig i nästa steg.

33

Tabell 6. Egenvärden för korrelationsmatrisen.

Numrering Egenvärden % av varians Ackumulerad

1 5,37427 44,79% 44,79% 2 3,168772 26,41% 71,19% 3 1,599416 13,33% 84,52% 4 1,213553 10,11% 94,63% 5 0,383871 3,20% 97,83% 6 0,128627 1,07% 98,90% 7 0,060989 0,51% 99,41% 8 0,03517 0,29% 99,71% 9 0,018192 0,15% 99,86% 10 0,000526 0,00% 99,86% 11 0,005432 0,05% 99,91% 12 0,011183 0,09% 100,00%

Figur 29. Scree plot för samma datamaterial som i Tabell 6.

Steg 3 går ut på att bestämma och tolka faktorerna. Faktorernas laddningar för olika variabler utgör kolonnvektorer i matrisen Λ, se Tabell 7. Faktoranalysen genomförs i MATLAB med kommandot

factoran(X, m). Förutom laddningar innehåller Tabell 7 en spalt som heter kommunalitet som

beskriver hur stor del av en variabels variation som beskrivs av faktorerna. Ett lågt värde, 0,5 och lägre, innebär att faktorerna inte beskriver variabeln bra och det kan vara aktuellt att ta bort variabeln. Den näst sista raden är summan av faktorns egenvärde och ger en handvisning om hur stor del av variationen som varje faktor beskriver. Ett högre värde beskriver större del av variationen. Den sista raden visar den procentuella andelen av faktorns egenvärde. Låga värden på egenvärdet betyder att liten del av variationen beskrivs av faktorn och låga värden på procenttalet indikerar att det kan var aktuellt att minska antalet faktorer. I nedre högra hörnet finns värdet 6,468, som är summan av faktorernas egenvärde och under det 92,41 %. Det betyder att dessa faktorer beskriver 92,41 % av variablernas variation.

Om en variabel har laddning 0 innebär det att faktorn inte beskriver variabelns variation bra. Målet är att varje variabel endast ska ha signifikant laddning för en faktor. Om en variabel har signifikant laddning för fler än en faktor kallas det korsladdning. Om det finns korsladdningar kan matrisen Λ

0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 8 9 10 11 12 13 Eg e n vär d e n Antal faktorer

Scree plot

Identifierade böjar

34

roteras. Det finns fler olika rotationer, i MATLAB finns till exempel ortomax, varimax och promax. Olika rotationer testas tills Λ inte har några korsladdningar.

Tabell 7. Resultatet av faktoranalys, matrisen Λ, laddningarna för de studerade variablerna. De signifikanta värdena är fetstilta.

Ingen rotation 1 2 3 Kommunalitet

Aspect ratio -0,83693 -0,05646 0,523375 0,978 Area -0,5211 0,829053 -0,10581 0,970 Cirkularitet 0,943064 0,290448 0,145882 0,995 Feret -0,80328 0,580929 0,080111 0,989 MinFeret -0,03141 0,817578 -0,53016 0,950 Round 0,78689 0,058719 -0,5412 0,916 Soliditet 0,481738 0,366121 0,551757 0,671 Summa egenvärde 3,359 1,918 1,191 6,468 % egenvärde 47,98% 27,40% 17,02% 92,41%

Efter utförd faktoranalys jämförs resultaten mellan olika prov, där likheter och skillnader identifieras. För att kunna jämföra resultaten från olika faktoranalyser krävs att samma antal faktorer använts samt att Λ har samma rotation.

3.5.2 Flisighetsindex

Syftet med flisighetsindextesterna är att undersöka om denna går att göra med bildanalys istället. Ett virtuellt test utformades för att kunna utvärdera flisighet från fotografier. Testet går ut på att sortera in varje korn i en storleksfraktion d/D och sedan testa om detta korn är flisigt, alltså om minsta diametern är mindre är D/2. Sedan jämförs resultatet från laborationstestet och det virtuella testet.

För att kunna dela in kornen i storleksfraktioner krävs vissa antaganden. Flisighetsindex är ett test som testar kornets form i tre dimensioner, men endast två diametrar (och två dimensioner) identifieras vid en bildanalys. Vanligtvis antas det att vid fotografering är det den minsta diametern som faller bort (Rodriguez et al., 2013). Detta bortses från och istället antas att den minsta diametern c och den intermediära diametern b identifieras vid bildanalys, alltså att den största diametern a faller bort. Detta görs för att det är dessa diametrar som krävs för att utföra flisighetsindextest. Figur 30 visar vilka diametrar som mäts vid bildanalys. Det innebär att antagandet lyder c=MinFeret och b=Feret, se även Figur 31.

35

Figur 30. Diametrar som identifieras vid bildanalys.

Vid bildanalysen mäts Ferets diameter och Ferets minsta diameter och presenteras i en tabell. Det första steget i det virtuella testet är att sortera in kornen i fraktioner. Samma fraktioner som för laborationstestet används (se Tabell 4 i avsnitt 3.3). För att ett korn ska passera den större sikten D krävs att c<b<D, alltså MinFeret<Feret<D. För att ett korn ska stanna på den mindre sikten d krävs att b>d, alltså Feret>d. Det innebär att Feret är den enda parametern som styr vilken fraktion som ett korn ska tillhöra enligt d<Feret<D, se Figur 31.

Figur 31. Ett korns dimensioner tillsammans med (från vänster) minsta siktvidd d, största siktvidd D och spaltsikt

Related documents