Examensarbete C Grundnivå
15 hp Vårterminen 2020
Livsmedelshygieniska faktorer – En
strukturell ekvationsmodell om studenters bakgrund, kunskap, beteende och attityd gällande
livsmedelshygien
Gustaf Eskhult
Statistiska Institutionen Box 513
Besöksadress:
Ekonomikum,
Kyrkogårdsgatan 10
751 22 Uppsala
UPPSALA UNIVERSITET Statistiska Institutionen Examensarbete C 15 hp Grundnivå
Titel: Livsmedelshygieniska faktorer – En strukturell ekvationsmodell om studenters bakgrund, kunskap, beteende och attityd gällande livsmedelshygien
Författare: Gustaf Eskhult Handledare: Ronnie Pingel
SAMMANFATTNING
I en studie från 2018 baserad på deskriptiv statistik undersöks studenters kunskap och
kunskapsbakgrund, attityder och självrapporterat beteende gällande livsmedelshygien. Studien kom fram till att utbildning spelar roll för kunskapsläget gällande livsmedelshygien.
I denna studie appliceras de data som användes i föregående studie, till att bygga en
strukturell ekvationsmodell utifrån fyra faktorer; Bakgrund, Kunskap, Attityd och Beteende.
Den strukturella ekvationsmodellen är inspirerad av tidigare forskning på området och är menad att se om liknande resultat reproduceras i detta dataset. Faktorerna ställs upp i ett vägdiagram med tyngdpunkt på att undersöka om det är attityder eller kunskap som påverkar individers beteende inom livsmedelssäkerhet. Modellen bedöms enligt de olika Goodness of fit (GFI) värden som följer; 𝜒2 – test, comparative fit index (CFI) samt root mean square error of approximation (RMSEA). Bedömningen är att CFI ska vara över 0,9 och RMSEA under 0,08.
Modellen som testas tar upp huruvida om respondenternas bakgrund påverkar kunskap, om kunskap påverkar beteende och attityd. I ett sista steg undersöks huruvida om beteende påverkas av attityder. Tre modeller har tagits fram och utformningen av vägdiagrammet är densamma för alla tre modellerna. Modell 1, en full modell med alla variabler som ansetts tillräckligt tillförlitliga efter databearbetning. Modell 2, en mer specifik modell där utsållning av variabler med svag faktorladdning har skett. Modell 3, en reducerad modell där enbart några få variabler med starka faktorladdningar inom givna områden testats. Nested Anova används för att se om det finns signifikant skillnad mellan dessa modeller.
I Modell 1 ses det vilka variabler som har för svaga kopplingar till faktorn de knyter an till, och därmed är rimliga att tas bort till nästa modelltest. Modellen har även ett för lågt CFI- värde för att inte förkastas. Modell 2 har dels en mångsidighet gällande de variabler som bygger upp faktorerna, samt godkända GFI-värden enligt de kriterier som satts upp för denna studie. Modell 3 däremot ger antydningar om att det är en ospecificerad modell, och har dessutom CFI som visar på en dålig passning med modellen, och därför förkastas. Modell 2 är en godkänd modell som dessutom är relevant i dess uppbyggnad och kan användas.
Sammantaget visar alla tre modellerna på snarlika samband, nämligen att det är just attityder som i högre utsträckning påverkar beteenden gällande livsmedelshygien, och inte kunskap.
Även om inte kunskap direkt påverkar beteenden, påverkar kunskap ens attityd som agerar som mellanhand till beteende.
Detta bekräftar tidigare studier gjorda inom detta forskningsområde.
UPPSALA UNIVERSITY Department of Statistics Bachelor thesis, 15 ECTS Undergraduate
Title: Food hygiene factors - A structural equation model for students' background, knowledge, behaviour and attitude regarding food hygiene
Authors: Gustaf Eskhult Supervisor: Ronnie Pingel
ABSTRACT
In a 2018 study based on descriptive statistics, students' knowledge and knowledge
background, attitudes and self-reported behaviour regarding food hygiene are examined. The study found that education plays a role in the state of knowledge regarding food hygiene.
In this study, the data used in the previous study is applied to build a structural equation model based on four factors, Background, Knowledge, Attitude and Behaviour. The structural equation model is inspired by previous research in the field and is intended to see if similar results can be reproduced in this dataset. The factors are presented in a path diagram with the emphasis on examining whether attitudes or knowledge influence the behaviour of individuals in food safety. The model is assessed according to the various Goodness of fit (GFI) indices that follow; 𝜒2 - test, comparative fit index (CFI) and root mean square error of
approximation (RMSEA). The assessment is that CFI needs to be above 0.9 and RMSEA below 0.08.
The model being tested addresses whether respondents' background affects knowledge, whether knowledge affects behaviour and attitudes. In one final step, we examine whether behaviour is affected by attitudes. Three models have been developed and the design of the road diagram is the same for all three models. Model 1, a full model with all variables considered sufficiently reliable after data processing. Model 2, a more specific model in which screening of variables with weak factor loading has taken place. Model 3, a reduced model where only a few variables with strong factor loadings within given areas were tested.
Nested Anova is used to see if there is a significant difference between these models.
In Model 1 it is seen which variables have too weak links to the factor they relate to, and thus are reasonable to be removed for the next model test. The model also has too low CFI value not to be rejected. Model 2 partly has a versatility in the variables that build up the factors, as well as acceptable GFI-values according to the criteria set up for this study. Model 3, on the other hand, gives indications that it is an unspecified model, and also has a CFI that shows a poor fit with the model and is therefore rejected. Model 2 is an approved model that is also relevant in its design and can be used.
All in all, all three models show similar connections, namely that it is precisely attitudes that influence food hygiene behaviours to a greater extent, and not knowledge. Although
knowledge does not directly affect behaviour, knowledge affects one's attitude, which then act as an intermediary to behaviour.
This confirms previous studies made in this field of research.
1
Innehåll
1. INTRODUKTION ... 2
1.1 SYFTE ... 3
2. FORSKNINGSLÄGE ... 4
3. METOD ... 6
3.1 STRUKTURELLA EKVATIONSMODELL ... 6
3.1.1 Modellen ... 7
3.1.2 Parameterskattning ... 7
3.1.3 Faktorladdningar ... 8
3.1.4 Möjliga problem ... 8
3.2 OLIKA GOODNESS OF FIT INDEX ... 9
3.2.1 𝜒2 – test ... 9
3.2.2 Root mean square error of approximation (RMSEA) ... 10
3.2.3 Comparative Fit Index (CFI) ... 11
3.3 NESTED ANOVA ... 11
3.4 FACE VALIDITY ... 12
4. DATA ... 13
4.1 BAKGRUNDSVARIABLER ... 13
4.1.1 Frågor till respondent om bakgrund ... 13
4.1.2 Datahantering ... 14
4.2 BETEENDEVARIABLER ... 14
4.2.1 Frågeställningar till respondent om beteende ... 14
4.2.2 Datahantering ... 15
4.3 ATTITYDSVARIABLER ... 16
4.3.1 Frågor till respondent om attityder ... 16
4.3.2 Datahantering ... 16
4.4 KUNSKAPSVARIABLER ... 16
5. RESULTAT ... 17
5.1 MODELL 1:FULL MODELL ... 17
5.2 MODELL 2:SPECIFIK MODELL ... 18
5.3 MODELL 3:REDUCERAD MODELL ... 19
5.4 SLUTRESULTAT ... 21
6. DISKUSSION ... 22
KÄLLFÖRTECKNING ... 23
BILAGA 1: VARIABELSAMLING ... 25
BILAGA 2: OUTPUT FRÅN FULLA MODELLEN ... 30
BILAGA 3: OUTPUT FRÅN SPECIFIKA MODELLEN ... 32
BILAGA 4: OUTPUT FRÅN DEN REDUCERADE MODELLEN ... 34
BILAGA 5: ENKÄT ... 36
2
1. Introduktion
I början av 2018 lade Frida Hellkvist och Elin Zetterström, två studenter vid institutionen för kostvetenskap fram sitt examensarbete ” Utbildning i livsmedelshygien gör skillnad – en kvantitativ studie om livsmedelshygien bland studenter vid universitet och högskolor i Sverige” (Hellkvist, Zetterström, 2017). Syftet var att undersöka attityder och beteenden gällande livsmedelshygien bland studenter i landet för att kunna dra slutsatser gällande huruvida dagens utbildning kring livsmedelshygien är tillräcklig.
Hellkvists och Zetterströms examensarbete är en kvantitativ studie gjord genom enkätundersökning bland 606 studerande vid landets högskolor. Studiens syfte var att undersöka tidigare kunskaper, attityder och självrapporterat beteende beträffande
livsmedelshygien bland Sveriges studenter. Detta för att kunna dra slutsatser gällande hur tillräcklig dagens utbildning av livsmedelshygien är.
Studien byggde på framförallt deskriptiv statistik, och undersökte skillnader mellan kön, ålder, angivna kunskapskällor samt självupplevd kunskap. Vidare undersöker studiens författare förhållandet mellan självrapporterat beteende och antalet korrekta svar vid kunskapsfrågor där man fick besvara sant eller falskt. Man bedömde även hur respondenternas syn på livsmedelshygien gällande handtvätt och kylförvaring.
Slutsatserna av Hellkvists och Zetterströms studie visade på att fler antal rätt på kunskapsfrågorna var korrelerade med gymnasial och eftergymnasial utbildning i livsmedelshygien. Det framkom även att flertalet respondenter som svarat rätt på kunskapsfrågor hade ett säkrare självrapporterat beteende. Detta gav slutsatsen att mer utbildning inom livsmedelshygien behövs.
Avslutningsvis i studien spekulerar Hellkvist och Zetterström i framtida forskning på området. Deras sista mening i studien var
”Slutligen skulle vidare forskning om vad som påverkar människors beteende gällande livsmedelshygien vara intressant.”.
Det är där denna studie tar vid.
3
1.1 Syfte
De data som Hellkvist och Zetterström samlade innehåller en bredd som tillåter att den används till ytterligare analyser. I formuläret så ställs 28 frågor kopplade till studenters förhållande gentemot livsmedelshygien utifrån fyra olika perspektiv, totalt innebär detta 54 olika variabler efter datahantering. I formuläret frågar man respondenterna om deras bakgrund gällande livsmedelshygien, dels kring specifik kunskap, attityder samt i självrapporterat beteende. Dessa 54 variabler kan fogas samman till att det finns fyra olika kategorier i förhållande till livsmedelshygien – Bakgrund, Kunskap, Attityd och Beteende. Dessa fyra kategorier av variabler kan omvandlas till faktorer och därmed går det att undersöka huruvida faktorer påverkar andra faktorer enligt principerna i en strukturell ekvationsmodell.
Tidigare forskning inom området har gjorts, och presenteras i forskningsläget i kapitel 2. I den forskningen undersöker man om huruvida det är individers attityder eller deras kunskap som faktiskt påverkar deras beteende i förhållande till livsmedelshygien. Dessa studier i likhet med denna bygger på enkätundersökningar och stället liknande frågor till respondenterna. Därför är det av intresse att bygga upp en ny analys på detta dataset för att se om resultatet blir snarlikt.
Den centrala frågeställningen är således;
• Är det kunskap eller attityder som främst påverkar individers beteende i förhållande till livsmedelshygien?
Givet att datasetet utgår till stor del utifrån bakgrund samt givet föregående studies tematik att undersöka just bakgrund och kunskap, är den sekundära frågan;
• Hur pass starkt påverkar ens bakgrund ens kunskap?
Modellen som testas i denna analys är framtagen gemensamt mellan Statistiska institutionen och Institutionen för Kostvetenskap vid Uppsala Universitet, med inspiration från de tidigare studierna som bedrivits. Tre modeller testas inom ramarna för denna studie. En ”full modell”, som innehar alla variabler som går att använda inom datasetet. En ”specifik modell”, som sorterar bort de variabler som inte har tillräckligt starka faktorladdningar. Samt en ”reducerad modell” som vidare sorterar bort variabler med svaga faktorladdningar och koncentrerar sig på specifika områden inom livsmedelshygien.
Resultatet bedöms huruvida variabler påverkar faktorer korrekt inom modellerna, det vill säga att de förhåller sig inom de värden som påpekar att modellen är rätt specificerad. Men
framförallt om modellerna kan leverera ett signifikant resultat samt klara väsentliga
gränsvärden som visar på om teorin modellerna bygger på passar ihop med de data som de
grundar sig på, och huruvida de bekräftar den forskning redan utförd inom området.
4
2. Forskningsläge
Detta kapitel adresserar forskningsläget gällande den strukturella ekvationsmodell (SEM) som prövas. I huvudsak har tre tidigare arbeten kunnat tas fram som utför en SEM inom området livsmedelshygien och vad som påverkar beteenden. Motiveringen för att modellen ser ut som den gör hänvisas till forskningen som under ett halvt sekel, med början 1975 där man
etablerar att kunskap, attityd och beteende hänger ihop (se Schwartz 1975 genom Ko, 2012, s.193). Studier påvisar även att attityd har en förmedlande roll mellan kunskap och beteende (se Rennie 1995, genom Ko, 2012, s.193 och genom Sanlier & Baser, 2019, s.2). Detta sammantaget motiverat modellen i figur 1.
I den senaste studien publicerad 2019, har Nevin Sanlier och Furkan Baser undersökt förhållandet mellan Kunskap, Beteende och Attityd gällande 1219 unga turkiska kvinnor mellan åldrarna 20 – 25 år. Motiveringen i studien till varför unga kvinnor använts som målgrupp i studien är att ansvar för inköp och tillagning av mat tenderar främst vara en syssla som kvinnor utför i turkiska hushåll. Undersökningen baseras på anonyma intervjuer gjorda med kvinnor i Ankara. Enkätens frågor var framtagna med hjälp av hygienstandarder
framtagna av World Health Organisation och undersöker respondenternas kunskap, attityder och självrapporterade beteenden. Data från enkätstudien har tagits in i en strukturell
ekvationsmodell som ses i figur 1. Studien (*) påvisar att attityder har en förmedlingsroll mellan kunskap och beteende.
Som kuriosa bör det nämnas att Sanlier och Baser testade även modellen genom att plocka bort attityder ur deras SEM, vilket gav utslaget att kunskap påverkade beteende, men så fort man lade till attityder så var kunskap och dess direkta anknytning till beteende irrelevant (Sanlier & Baser, 2019 s.6). Detta motiverar deras påstående att attityder har en förmedlande roll mellan kunskap och beteende.
Wen-Hwa Ko har 2012 (**) på liknande sätt undersökt restaurangbranschen i Taipei, Taiwan.
Frågor gällande beteenden enligt ”hazard analysis and control point”-principer (HAACP) samt gällande kunskap och attityder i förhållande till livsmedelshygien har ställts till restauranganställda med 421 godkända svar. HAACP-principerna bygger däremot inte på självrapporterat beteende utan på test gällande påståenden om beteenden (Coleman et al, 2000, s.150). Liksom Sanlier och Baser påvisar Ko att det finns en förmedlande roll för attityd mellan kunskap och beteenden, däremot en svagare koppling mellan attityd och kunskap.
Figur 1: Resultat från de strukturella ekvationsmodellerna utförda av Sanlier & Baser 2019 (*), Hwa Ko 2012 (**) samt Baser et al 2016 (***). I Baser et al testar man korrelation mellan attityder och kunskap istället för hur kunskap påverkar attityd som de andra två studierna undersökt.
5 Baser et al, med bland annat samma forskare bakom 2019 års studie, har även undersökt hotellpersonal i Turkiet i en studie från 2016 (***). I en studie gjord på 498 hotellanställda enligt samma upplägg gällande kunskaper, attityder och självrapporterat beteende. Skillnaden är att istället för att använda faktorladdning (se kapitel 3.1.3) använde man korrelation för att mäta sambandet mellan kunskap och attityd. Korrelationen mellan attityd och kunskap kan bedömas som godkänd, och påvisar att attityd har en förmedlande roll mellan kunskap och beteenden.
Dessa tre studier motiverar modellen som kommer testas i denna studie och modellen presenteras i kommande metodavsnittet (se figur 2, kapitel 3.1.1). I alla tre studierna beskrivna ovan har man valt ett upplägg där man har skapat specifika faktorer såsom
”korskontaminering”, ”nedkylning” och så vidare utifrån de variabler som finns vars frågor och svar berör den specifika faktorn man bygger upp. Dessa faktorer har sedan anknutits till latenta variabler såsom Beteende, Kunskap och Attityd vilka är dem man testar och som ses i Figur 1. I den analys som utförs inom ramarna för den här studien däremot, kommer
variablerna direkt knyta an till den de latenta variablerna.
För att få en bättre överblick utöver figur 1, har de Goodness-of-fit index (GOF) som
respektive SEM-modell i de tre studierna kommit fram till lagts in i Tabell 1. Comparative Fit Index (CFI), Root mean square error of approximation (RMSEA) samt Normed ꭓ
2förklaras närmre kapitel 3.2 där en genomgång sker av de olika Goodness-of-fit index som används inom ramarna för denna studie.
Tabell 1: Goodness of fit index för de tre studierna
Studie År Normed ꭓ2 P-värde (CFI) (RMSEA)
Sanlier & Baser (*) 2019 2.531 - 0.958 0,037
Ko (**) 2013 1,81 0,000 0,99 0,044
Baser et al (***) 2016 2,29 >0,01 0,85 -
6
3. Metod
I detta avsnitt tas uppbyggnaden av den strukturella ekvationsmodell som skall testas upp.
Utöver modellen kommer parameterskattningar, bedömning av faktorladdningar och
”Goodness-of-fit” tas upp. Utöver SEM kommer även ”Nestad ANOVA” förklaras och hur metoden används för att testa huruvida de olika modellvalen är signifikant skilda från varandra.
Först kommer den statistiska processen att förklaras. Syftet med analysen är att ta fram tre modeller och avgöra dels om den modell som testas är rimlig, och för att i nästa steg se vilken modell som är den bättre. Statistiska institutionen besitter inte forskningskunskapen kring livsmedelshygien, därför är det Institutionen för Kostvetenskaps del i den statistiska processen att dels rangordna den delen av den ordinala data som kräver specifik forskarkompetens, men även att sålla ut de data som inte är relevant för analysen.
En första modell har tagits fram av datamaterialet, där alla variabler som går att användas inom regler som gäller för ordinal data, har tagits med. Det har sedan varit upp till Statistiska Institutionen i samråd med Institutionen för Kostvetenskap att reducera antalet variabler inför test av Modell 2. I nästa steg testas Modell 3, där syftet är att reducera Modell 2 på ytterligare variabler och se om de det gör någon skillnad för modellens passning till data.
Sist i denna inledning kan det kort nämnas att i denna analys används programvaran RStudio med tilläggspaketet ”Lavaan” för att kunna genomföra den strukturella ekvationsmodellen samt för att kunna genomföra Anova.
3.1 Strukturella ekvationsmodell
Grunden till en strukturell ekvationsmodell (SEM) är att testa en specifik underbyggd struktur mellan olika latenta variabler som vi kallar faktorer. Det kan antingen handla om att det antingen finns korrelation mellan faktorer eller att en faktor förklarar den andre faktorn (Hair et al, 2014, s.565). I modellen som testas här, är det förklarande förhållanden mellan faktorer som testas. Strukturell ekvationsmodell utgör närmast en slags serie av regressioner. Faktorer är underbyggda strukturer som inte kan direkt mätas, utan utgörs av de indikatorvariabler som är synliga och mätbara. I Figur 2 på följande sida, ses sambanden i modellen som skall testas i denna analys.
I SEM skiljer man på exogena och endogena faktorer. Exogena faktorer är de som enbart är förklarande latenta variabler till en annan faktor i modellen. Endogena kan både vara latenta responsvariabler eller förklarande variabler. Sambanden mellan variabler testas genom regression mellan faktorerna som påvisas genom de fetmarkerade pilarna. I regression testar man huruvida förklarande variabler påverkar responsvariabler, så kallade responsvariabler.
Pilarna representerar parametrar och därmed illustrerar sambandet, där pilarna går från den
förklarande variabeln till responsvariabeln. Värdet på parametrarna är standardiserat och
således går mellan -1 och 1 där starkt negativa samband eller starkt positiva samband
eftersträvas (Hair et al, 2014, s.618). Detta beror i stor utsträckning vilka indikatorvariabler
som faktorn består av och diskuteras i kapitel 3.1.3.
7 3.1.1 Modellen
Det dataset som modellen utgörs av, består av 68 variabler som kan delas in i fyra olika kategorier, som i denna analys ska utgör faktorerna som skall prövas. Det denna analys skall undersöka är en specifik struktur om huruvida ”Bakgrund” är förklarande till ”Kunskap”, och sedan huruvida ”Kunskap” är förklarande till ”Attityd” och ”Beteende”. Sist ser vi huruvida
”Attityd” är en förklarande variabel till ”Beteende”.
Modellen är framtagen med hjälp av forskare på Statistiska institutionen samt Institutionen för kostvetenskap vid Uppsala Universitet, och då med inspiration från modellerna ifrån
forskningsartiklarna som sammanfattats i kapitel 2 om forskningsläget. En skillnad är att istället för Kunskap är Bakgrund den exogena variabeln. Detta givet att enkäten inkluderade många frågor om just bakgrund vilket således ger möjligheten att undersöka om
utbildningsbakgrund, uppväxtfaktorer och så vidare faktiskt påverkar respondenternas kunskap. Detta tillägg särskiljer studien dessutom från Sanlier & Baser, Ko och Baser et al.
Till skillnad från ovannämnda studier uppdelas variablerna i denna studie inte i underfaktorer som sedan knyts an till den latenta variabel som ska testas, utan alla variabler laddar direkt mot den latenta variabeln.
För att se hur dessa indikatorvariabler har kodats, se bilaga 1. Kapitel 4 kommer att gå igenom vad datasetet samt vad respektive faktor består av för variabler, hur de är kodade och vilka variabler som har sållats bort.
3.1.2 Parameterskattning
”Maximum Likelihood” (ML) är den metod som är vanligast förekommande i strukturella ekvationsmodeller för att skatta parametrarna vilket är sambanden mellan såväl observerade variabler och latenta variabler som sambanden mellan latenta variabler. Men eftersom de data som analysen grundar sig på variabler som byggts på nominalskala och Likertskala vilket innebär att det är ordinal data som skall behandlas, rekommenderas ”Weighted Least Squares”
(WLS). Denna metod är mer förlåtande när det kommer till icke-normalitet i datasetet vilket inkluderar analys av ordinala variabler (Hair et al, s.575). Att Weighted Least Squares används berör även de “Goodness of fit” som bedömer om modellen stämmer väl överens med data. Detta diskuteras mer utförligt i avsnitt 3.2.
Figur 2: En figur av modellen som skall testas. De fetmarkerade pilarna utgör regression mellan latenta variabler även kallat faktorer. Pilen utgår ifrån den förklarande variabeln till den responsvariabeln. Regressionen testar hur mycket den förklarande påverkar responsvariabeln i standardiserade värden från -1 till 1.
8 3.1.3 Faktorladdningar
Faktorladdningar är parametrarna mellan indikatorvariabler och de latenta variablerna (faktorerna) men även de som går mellan latenta variabler. Man vill att dessa ska vara över 0,7 men det är tillräckligt om de är över 0,5 enligt Hair et al. Detta beror på variabelns
förklarade varians även kallat kommunalitet, det vill säga den varians som variabeln delar den latenta variabel som laddar mot den. Den övriga variansen är således varians från variabelns error-term, och är således den andel varians som finns kvar som inte kan förklaras av
sambandet mellan indikatorvariabel och latent variabel. Detta räknas ut genom att kvadrera faktorladdningen. Om man kvadrerar 0,71 får man 0,5. Vad detta säger är att 50 procent av variansen kan förklaras av förhållandet mellan indikatorvariabel och latent variabel. (Hair et al, 2014, s. 618).
Det pågår en diskussion bland forskare om hur låg en faktorladdning bör vara och det lämnas en viss frihet till analytikerna ifråga att själv bestämma vilket ”cut-off”-värde, det vill säga vilket värde som en faktorladdning måste vara över för att det ska anses acceptabelt. Den liberala hållningen är då att 0,4 och uppåt är acceptbart, medan den konservativa hållningen är att faktorladdningar ska vara minimum mellan 0,6 till 0,7, men att så låga faktorladdningar som 0,2 kan vara accepterbar i samhällsorienterade forskningsämnen (Matsunaga, 2010, s.101). Hair et al påpekar däremot att runt 0,3 är ett slags minimum för att kunna uttolka strukturen i faktorn (Hair et al, 2014, s. 115). I likhet med faktorladdningar mäts strukturella förhållanden (parametrar) mellan latenta variabler på samma skala mellan -1 till 1. En modell anses acceptabel då strukturella förhållanden är mindre eller större än noll och påvisar
statistisk signifikans i den förväntade riktningen (Hair et al, 2014, s. 589, 622).
I denna analys kommer tolkningen av faktorladdningar vara med hänsyn till huruvida de bygger upp modellen först och främst. De enda indikatorvariabler som exkluderas i ett tidigt stadium i den statistiska processen är dem med faktorladdningar under 0,2.
3.1.4 Möjliga problem
Denna text utgår ifrån problem som kan förekomma vid strukturella ekvationsmodellen och som rimligen bör nämnas. En strukturell ekvationsmodell ska helst alltid byggas på en underliggande teori (Hair et al, s.565). Det bör nämnas att ett av problemen med att utföra SEM, är då man utför det på redan inhämtade data. En av förutsättningarna för denna studie är att modellen bygger på redan inhämtade data genom ett enkätformulär som analytikern inte har medverkat i. Detta kan leda till felspecificerad modell (personality-project.org, 2019). En studie där teorin och frågorna för den strukturella ekvationsmodellen som skall prövas har utformats samtidigt som man utformar enkäten för att ta fram data, är därför mer fördelaktigt om man vill undvika felspecificerade modeller.
I syfte att komma runt detta problem, har så kallad ”Face Validity” applicerats. Forskare vid
Institutionen för Kostvetenskap och Statistiska institutionen har deltagit i processen för att
dels bestämma hur den strukturella ekvationsmodellen ska se ut, samt hur relevanta variabler
ska kodas. I kapitel 3.4, beskrivs processen för att försäkra om att de variabler som används är
relevanta för de modeller som testas i denna analys.
9
3.2 Olika Goodness of fit index
Två saker är av stor vikt då man tolkar ett resultat i SEM. Först ser man till hur modellen passar till data, så kallad ”Goodness of fit” (GFI). Normalt sett använder man tre till fyra olika mått för att se om modellen passar de data man arbetar med. Rekommendationen är att minst ha ett absolut mått och ett relativt mått men man kan ha ett för att testa just ”Goodness of fit”, eller GFI (Hair et al, 2014, s. 583). Absoluta mått avgör huruvida bra en modell passar de data man testar. Här är Chi-två testet framstående. Relativa mått är snarare hypotes-test där man till exempel jämför ett antagande om modellen för att se om det är sant. Hair et al påvisar att Chi-två test där man ser på ens teststatistika och p-värde, samt Comparative Fit (CFI) index samt Root Mean Square Error of Approximation (RMSEA) duger för att fastställa om modellen passar och därför används dem i denna analys.
Det finns däremot en debatt kring detta som pågår om alla mått behövs för att fastställa om modellen passar. När det gäller CFI och RMSEA som mått har diskussionen pågått sedan 1970-talet vilka värden som anses tyda på att modellen passar. Detta kommer att diskuteras genomgående för respektive test som används. Men redan nu nämns vilka värden som denna analys kommer att bedömas utefter i Tabell 2.
Tabell 2: Gränsvärden för Goodness of fit index
Goodness of fit Index Gränsvärden
P-värde P obs < 0,05
𝜒2 𝜒2 obs < estimator för nollmodellen 𝜒2-normed 𝜒2 obs /d.f < 3:1 ratio
Robust RMSEA RMSEA obs < 0,08*
Robust CFI CFI obs > 0,90*
*Man eftersträvar lägre RMSEA och högre CFI, men båda måtten bör för en given modell vara inom gränsvärdena för att inte förkastas.
3.2.1 𝜒2
–test
Chi-två-test (𝜒2
-test) används för att mäta hur bra modellen passar data genom att jämföra observerad kovariansmatris och estimerad kovariansmatris. (Hair et al, 2014, s. 542, s. 577- 578). Vid hypotesprövningar söker man ofta att det finns signifikant skillnad mellan
observerade data och estimat. I SEM är det tvärtom, 𝜒2
-värden närmare noll indikerar att det inte finns skillnader mellan den kovariansmatris som modellen bygger på och den estimerade kovariansmatrisen vilket säger att modell och data stämmer överens. Likaså är det inte nödvändigt med att ens data ska vara signifikant. Det vill säga p-värdet kan vissa fall få överstiga 0,05. Vid över 12 variabler och ett stickprov över 250 förväntar man sig dock statistisk signifikans vilket finns i alla tre modellerna som testas i denna studie.
I ett test ett stort stickprov ska 𝜒2
–test observeras med viss risk, då resultatet av ett 𝜒2
–test
förstärks av antalet observationer och antalet variabler. Det vill säga fler observationer och
fler variabler tenderar att skapa ett större 𝜒2
–värde medan vi söker ett värde som är under det
värde som 𝜒2-fördelningen visar att vi ska ha, och helst gå mot noll. Normed 𝜒2 – test är att
man tar ens teststatistiska och delar en på antalet frihetsgrader för att komma runt problemet
med inflaterat 𝜒2-värde. Hair et al menar på att man bör eftersträva att ens ratio mellan 𝜒2-
teststatistikan och frihetsgrader inte ska överstiga 3:1, men detta är liksom andra GFI-mått ska
detta betraktas som rekommendation enbart och just Normed 𝜒2 är inget som används i lika
hög utsträckning som CFI eller RMSEA.
10 𝑁𝑜𝑟𝑚𝑒𝑑 χ
2= χ
𝑘2𝑑𝑓
𝑘Oavsett vad, finns det en risk att modellen kan avvisas om den innehåller fler än 500 observationer enbart på grund av att det observerade 𝜒2-värdet inflateras av antalet observationer, och därför är det nödvändigt att se på ytterligare test.
3.2.2 Root mean square error of approximation (RMSEA)
RMSEA är en av de så kallade ”Absolute fit indices”, som bestämmer hur bra den teoretiska modellen passar eller reproducerar data. RMSEA är det vanligaste måttet som används för att komma tillrätta med att 𝜒2
-testet kan avvisa modeller på grund av att de data som modellen testas mot innefattar många variabler och ett stort antal observationer. Och med stort antal observationer menar man över 500 observationer. Till skillnad från 𝜒2
–testet, tar RMSEA med antalet variabler och storleken på stickprovet med i beräkningarna och försöker korrigera för detta. Värdet för RMSEA går mellan 0 till 1, och ett lågt värde indikerar att modellen stämmer överens med de data som modellen testas emot (Hair et al, 2014, s.579).
𝑅𝑀𝑆𝐸𝐴 = √ (χ
2− 𝑑𝑓
𝑘) (𝑁 − 1)
Däremot är det oklart vad som är ett acceptabelt värde. Auktoriteter inom området såsom Hu och Bentler (1999, s.1) menar på att ett cut-off värde på nära 0,06 bör användas för att
undvika att ospecifierade modeller blir accepterade. Hooper et al (2008, s.54) påvisar att 0,07 är ett mer acceptbart värde men menar på att fram tills sent 1990-tal ansågs 0,08 vara gränsen för en dålig passning mellan teoretisk modell och data. Däremot utgår de flesta studier som rekommenderar ”cut-off”-värden ifrån Maximum Likelihood (ML) som metod för
parameterskattning. ML överensstämmer inte väl med data som utgår ifrån ordinala värdeskalor och ökar risken för ospecifierade modeller (Xia & Yang, 2019, s.411).
Konsultverksamheten för statistik vid Cornell University däremot betraktar 0,08 som en definitiv gräns (Perry, 2019)
Rekommendationer från Hair et al är att vid ett stickprov på över 250 observationer behöver RMSEA vara under 0,07 men samtidigt påvisar att en exakt ”cut-off”-punkt för RMSEA som testet inte får överstiga är olämpligt att ge på grund av osäkerheten kring måttet (Hair et al, 2014, s.584). Xia och Yang som representerar den senaste forskningen påvisar däremot att olika goodness of fit index generellt ska tolkas som diagnostiska verktyg för att förbättra modellen. Den riktlinje de ger är att om RMSEA är förhållandevis högt jämfört med ett relativt lågt CFI (och TLI) indikerar att modellen inte passar bra (Xia & Yang, 2019, s 421).
I denna studie anses därmed att RMSEA över 0,07 som en mindre bra passning med data, och över 0,08 som en generellt sett dålig passning till data.
Ekvation 1: Uträkningen av Normed 𝜒2 där χk2 respektive dfk står för teststatistikan och antalet frihetsgrader i modellen man har estimerat
Ekvation 2: Uträkningen av RMSEA där dfk står för antalet frihetsgrader i modellen man har estimerat och N storleken på stickprovet.
11 3.2.3 Comparative Fit Index (CFI)
CFI är en del av ”Incremental fit indices” som jämför den estimerade modellen med en baseline-modell, en så kallad nollmodell som antar att alla observerade variabler är
okorrelerade. Grunden för CFI är ”Normed Fit Index” (NFI) som är ratio mellan 𝜒2-värdet för den estimerade modellen och nollmodellen delat på 𝜒2-värdet för nollmodellen. Detta är ett mått från 0 till 1 där 1 innebär en perfekt passning för ens modell innebär ett värde på 1. CFI bygger vidare på NFI-metodiken för samma problem som finns med 𝜒2
–testet och de problem som finns inneboende i NFI-testet (Hair et al, 2014, s. 579-580, s.595).
𝐶𝐹𝐼 = 1 − χ
𝑘2− 𝑑𝑓
𝑘χ
𝑁2− 𝑑𝑓
𝑁Hopper et al (2008, s.54) påvisar att 0,9 som cut-off värde sågs länge som en riktlinje tills Hu och Bentler (1999, s.1) förespråkade 0,95 som cut-off värde för CFI som har blivit standard.
Liksom RMSEA är värdena ofta är etablerade då maximum likelihood används, och skall tolkas med viss skepsis (Xia & Yang, 2019, s.411). Både Statistiska institutionen
1vid Uppsala Universitet såväl som rekommendationer vid Cornell University anger att 0,9 är ett fullgott CFI (Perry, 2019). Riktlinjer som Hair et al anger, menar på att data med över 30 variabler och en stickprovsstorlek på över 250 behöver vara över 0,9 men över 0,92 om det är färre än 30 variabler. Det är den rekommendationen som används vid resultattolkning i denna analys. För denna analys betraktas 0,9 som ett definitivt cut-off värde.
3.3 Nested ANOVA
Normalt sett används ”Analysis of Variance (ANOVA) för att jämföra olika populationers medelvärden och se om det finns en statistisk signifikant skillnad mellan populationerna (Hair et al, 2014, s. 666). En nestad Anova är däremot att se på samma population, med samma variabler. Skillnaden är att ena modellen kommer ha fler indikatorvariabler än den andra och betraktas således som en ”full model”, och den andra är en ”nested model” givet att den har färre indikatorvariabler men delar variabler med den fulla modellen. Man kan även ändra riktningar på regressionspilarna mellan faktorerna och testa dem genom denna metod (Hair et al, 2014, s. 588). I denna modell kommer endast variablerna att reduceras givet den ordning som beskrev i delkapitel 3.1.4 samt i nästkommande delkapitel 3.4 om Face Validity på nästa sida.
Resultatet från en Nersted Anova innebär att om resultatet ger signifikant skillnad mellan två modellerna som testas, och den nestade modellen har bättre ”Goodness of fit”-värden enligt förklaringen tidigare i detta kapitel, är den modellen den bättre. I fallet för denna analys är det tre modellval som skall prövas, och således två stycken Nested Anova-test. Ett för att jämföra om den Modell 2 är signifikant skild från Modell 1 som utgör den ”fulla” modellen. I ett nästa steg testas om Modell 3 är signifikant skild från Modell 2, där Modell 3 representerar den mest ”avskalade” modellen med minst antal indikatorvariabler.
1 Ronnie Pingel, Statistiska institutionen, handledarmöte den 14 augusti 2019
Ekvation 3: Uträkningen av CFI där nesänkt k står för modellen man estimerat och nedsänkt N för nollmodellen man jämför mot.
12
3.4 Face Validity
Face validity är egentligen ett uttryck för att låta testskapare subjektivt undersöka huruvida alla frågor i ett test är relevanta. Men ur en mer bredare aspekt kan detta även användas för att granska huruvida ett test är ett bra test och säger något kring vad man undersöker inom ens målgrupp (Anastasi, 1988, s.144 och Holden, 2010, s.637).
I denna studie har forskare vid Statistiska institutionen deltagit för att granska variablerna som skall användas och bedöma om de kan användas inom ramarna för denna studie. Institutionen för Kostvetenskap har deltagit för att granska hur framförallt beteende-variablerna kodas, så att de ger en korrekt bild av den forskning som bedrivs inom området för att kunna ta fram Modell 1.
I ett nästa steg granskas indikatorvariablerna mer, dels utifrån resultatet från Modell 1, men även utifrån om variablerna tillför relevant information till de latenta variablerna som de laddar emot. Syftet att reducera antalet variabler för att kunna prova en mindre och mer specifik variant av den första modellen, Modell 2.
För Modell 3, har ingen Face Validity skett, givet att Institutionen för Kostvetenskap betraktar
den första utsållningen för Modell 2 som tillräcklig. Där har variabler som berör några få
olika områden inom livsmedelssäkerhet, och med avseende på hur starka faktorladdningarna
är, tagits ut för att testas.
13
4. Data
I detta kapitel kommer vi att gå igenom respektive kategori av variabler och vilka frågor från enkäten de innehåller, samt resonera kring hur variabler har behandlats i den statistiska processen.
De data som Hellkvist Zetterström tagit fram baserade sig på en enkätundersökning bestående av 28 frågor som skickades ut i Google-enkät via Nationella nätverket inom utbildning i livsmedelsmikrobiologi (Hellkvist och Zetterström, 2018), vilket är ett nätverk för lärare inom universitet och högskolor. Undersökningen erhöll 607 svar, varav en person svarade på
frågorna men inte samtyckte till att ingå. Den respondentens svar har blivit utsorterat ur datasetet. Likaså har de tre personer som angav deras kön som ”annat” blivit utsorterade för att reducera variabler. Kvar blev 603 respondenter för analysen inför datahanteringen.
Det ursprungliga datasetet bestod av 60 variabler baserat på de 28 frågorna. Men eftersom enkätens två första frågor handlar om huruvida respondenterna kvalificerar sig till studien räknas dessa bort och 58 variabler återstod. Efter databearbetning skapades ytterligare 10 variabler utifrån de befintliga och datasetet bestod av 68 variabler som skulle användas.
Under analysens gång framkom det att ytterligare två enkätfrågor innehöll svar gällande specifika beteenden kring risklivsmedel och hygien gällande frukt och grönsaker som inte kunde tas med, och kvar blir 54 variabler som används. Efter databearbetningen återstår 408 respondenter som anses ha gett giltiga svar som går att användas.
Enkäten utgår i ifrån antingen nominala data som inte kan rangordnas och där varje värde i variabeln gjorts om till binära variabler. Eller ordinala data, det vill säga rangordnade data där avståndet mellan värdena i variablerna inte metriskt kan granskas. När det kommer till
bedömning av beteenden har Institutionen för kostvetenskap konsulterats (Marklinder, 2019, 29 mars, 2 april). Institutionens forskargrupps bedömning ligger till grund för vilka av beteendevariablerna som kan rangordnas utefter vilket beteende som är mest önskvärt, men även vilka som betraktas som binära – det vill säga att det enbart finns ett rätt beteende som tar värde antingen 0 eller 1. I denna analys kommer binära variabler betraktas som ett speciellt fall av ordinala data (Hale, 2019). Således betraktas all data som ordinala i denna studie.
4.1 Bakgrundsvariabler
I datasetet finns sju bakgrundsfrågor som utgör de bakgrundsvariabler som kommer användas i den här delen som beskriver utbildningsbakgrund, matvanor och hälsotillstånd i förhållande till livsmedelshygien.
4.1.1 Frågor till respondent om bakgrund
Respondenten har fått svara på fyra delfrågor i fråga 3 om hur ofta man har tillagat
mikrougnslagad mat, värmt färdiglagade såsom korv, färdiglagade köttbullar, fiskpinnar och vegetariska köttbiffar. Man frågar även om respondenten har tillagat mat utifrån råa livsmedel såsom kött eller kyckling samt om man har hanterat färska grönsaker såsom rotfrukter, potatis och purjolök. Dessa fyra olika typer av frågor kommer med fem möjliga rangordnade
svarsalternativ från aldrig till dagligen.
14 Respondenten har fått svara på frågor om vilken ålder den har (fråga 26), vilket kön
respondenten identifierar sig med (fråga 27) samt vid vilket högskolesäte respondenten är skriven vid (fråga 28). Vidare ställs frågor om vilken huvudkälla som respondenten har till kunskap i livsmedelshygien (fråga 21). Här finns ett antal svarsalternativ såsom att man får kunskapen via sina föräldrar, sin partner eller vän, genom hemkunskap, Livsmedelsverket, hälso- och sjukvården, eller någon kurs inom livsmedelshygien antingen inom gymnasiet eller inom högskolan. Vidare ställs fråga om man har läst en kurs i livsmedelshygien på antingen på gymnasiet, vid en högskola eller via livsmedelsföretag/yrkeshögskola (fråga 22). Sist ställs frågan om respondenten har blivit matförgiftad det senaste året (fråga 24) och då i så fall av egen mat (fråga 25), samt om man har lagat mat till andra under en tid då man har haft tillfällig diarré (fråga 17).
4.1.2 Datahantering
När det gäller bakgrundsvariablerna har två nya variabler skapats. Dels har frågan kring vilken högskola/universitet man tillhör förenklats till en binär variabel som säger huruvida man studerar vid något av de tio mest framstående svenska högskolorna enligt Times High Education’s World University Ranking (Times Higher Education, 2019). Denna variabel kan ses i bilaga 1, variabel B
23. Den andra variabeln som skapats är variabel B
5som ställer frågan om matförgiftning. Detta är en skapad variabel som möjliggjorts av att alla som på fråga 25 svarat att de har blivit matförgiftade av egen mat det senaste året, har även svarat på fråga 24 att de har råkat ut matförgiftning det senaste året. Fråga 21 som frågar respondenten om dess främsta kunskapskälla inom livsmedelshygien är av nominal skala och har därför delats upp i de binära variablerna B
10till B
20. Variabel B
24som anger om respondenten tycker att hälso- och sjukvården är viktigaste kunskapskällan för livsmedelshygien är referensvariabel och således inte med i undersökningen. Detta på grund av att den här lägst antal observationer.
Likaså har variabel B
25som anger om respondenten är kvinna fått bli referensvariabel. Detta då de är flest observationer som är kvinnor, och det är mer intressant att se hur männen påverkar faktorn givet traditionella könsroller som finns historiskt gällande ansvar för köket och hemmet.
Sammantaget utgör dessa 25 av de 54 variablerna i vår data.
4.2 Beteendevariabler
Respondenterna har i enkätundersökningen fått beskriva sin hantering av livsmedel och hur de går tillväga gällande livsmedelshygien. Frågorna präglas av att det finns flera olika
svarsalternativ. Flera av frågorna ställer upp fler än 4 svarsalternativ. Speciellt när det
kommer till mer specifika beteendefrågor gällande matlagning och hantering av köksmaterial.
4.2.1 Frågeställningar till respondent om beteende
Fråga 5, 6 och 7 berör hur man går tillväga när det kommer till att diskning under och efter
matlagning. Man frågar hur ofta respondenten byter till en ny/nytvättad disktrasa (fråga 5),
hur man rengör sin skärbräda (fråga 6) samt hur man går tillväga i situationer där man riskerar
korskontaminering med skärbrädan då man växlar mellan att sköra kött och grönsaker. Flera
av frågorna berör specifikt hur man hanterar livsmedel.
15 Respondenten får frågan om hur de ser att kyckling och hamburgare närmar sig att bli
färdiglagade vid tillagning (fråga 10 och 11). Under fråga 12 ställs tolv frågor om huruvida man undviker olika livsmedel på grund av sjukdomsrisk.
Respondenten får besvara frågor kring hur man hanterar nedkylning av mat direkt i samband med matlagning (fråga 14), gällande nedkylning vid medtagning av matlådor (fråga 16) samt hur ofta respondenten undersöker kylskåpstemperaturen i hemmet (fråga 19). En sista
kategori som tas upp i detta avsnitt är frågor som ställts till respondenten om hygien. Här ställs frågan om hur respondenten tvättar sina händer (fråga 9), samt under fråga 20 ställs tre frågor om man sköljer av salladshuvud och kruksallad, färdigskuren sallad och frukt.
4.2.2 Datahantering
På grund av att det finns vissa beteenden som är direkt icke-önskvärda och vissa som är mer eller mindre rätt eller fel, har beteendevariablerna behandlats av Institutionen för
Kostvetenskap på Uppsala Universitet (Marklinder, 2019, 29 mars, 2 april). De variabler som bedöms kunna rangordnas är variablerna H
1till H
7som ställer frågor om olika typer av beteenden gällande tillagning, nedkylning och användande av livsmedel.
Variablerna H
2till H
4berör specifikt handhygien, hur man diskar sin skärbräda och hur man hanterar risk korskontaminering då man ska byta behandling av livsmedel vid tillagning av mat. Här bedöms det finnas endast ett korrekt beteende. Just i variabel H
2har variabeln utformats mot rekommendationer från institutionen för kostvetenskap då de anser att endast disk i diskmaskin är det säkraste sättet för att rengöra en skärbräda. Då populationen vi undersöker är studenter och de allra flesta troligen bor i hushåll utan diskmaskin, blir således den variabeln en fråga huruvida man har diskmaskin istället för att handla om vad som är rätt beteende givet omständigheter. Således är både diskning via diskmaskin och handdisk med diskmedel rätt alternativ.
På vissa frågor lämnas det ett alternativ till respondenten att kunna svara avvikande, såsom att man inte utför ett visst beteende eller inte konsumerar vissa livsmedel. Här har det varit två olika tillvägagångssätt för att bemöta dessa variabler. Då respondenten säger att de inte konsumerar kött, eller att de inte lagar matlådor eller mat som behöver kylas ned för att förtäras vid ett senare tillfälle har dessa observationer tagits bort. Dessa variabler är H
5till H
9som har haft sådana svarsalternativ. Dessa observationer har tagits bort för bedömningen ska ske enbart på självrapporterat beteende.
Gällande fråga 12 och fråga 20 i enkäten (bilaga 5), som berör huruvida man undviker risklivsmedel eller om man sköljer grönsaker och frukt, har visat sig komplicerade att utföra analysen på. De är utformade som att de skulle kunna vara rangordnade från att man aldrig utför beteendet som efterfrågas, till att man gör det ibland, till att man alltid gör det. Men det finns även valet att svara att man inte äter den sortens risklivsmedel på grund av
livsmedelshygienisk risk, eller att man inte äter frukt och grönt som behöver sköljas. Att plocka bort de observationer som angett ett sådant svar innebär att man plockar bort hela datasetet. Således har dessa 14 variabler uteslutits från analysen.
Kvar blir 419 observationer utav de 603. Sammantaget utgör dessa 10 av de 54 variablerna i
vår data.
16
4.3 Attitydsvariabler
I denna kategori mäts attityden respondenterna har gällande ett visst beteende. Dessa frågor utgår ifrån att man tycker att något är inte alls viktigt till att det är mycket viktigt. I
enkätundersökningen finns det två frågor som ställs gällande attityd som i sin tur har flera delfrågor under sig.
4.3.1 Frågor till respondent om attityder
Under fråga 8 till exempel, ställs det fem frågor gällande hur viktigt man anser att
handhygienen är i köket beroende på situation, det vill säga när man anser att det är viktigt att tvätta händerna. Respondenten får svara på om handtvätt är viktigt innan matlagning, efter att man har hanterat köttfärs, kyckling, råa ägg, samt efter toalettbesök, totalt fem frågor. Fråga 15 är endast en fråga gällande hur viktigt det är med att man kyler maten inom fyra timmar efter att den har tillagats. Denna fråga anknyter till fråga 18 där respondenten får uppge sin kunskap om korrekt kylskåpstemperatur, samt anknyter den till beteendefrågor om hur respondenten hur respondenten agerar vid nedkylning av mat samt hur ofta man undersöker kylskåpstemperatur. Fråga 23 är ställd på liknande sätt, fast utifrån hur man bedömer sin egen kunskap gällande livsmedelshygien.
Undantaget är fråga 23, där man bedömer sin egen kunskap från ”mycket dålig” till ”mycket bra” i en femgradig skala med det sjätte valet att välja ”vet ej”. Attitydsvariablerna utgör sju av variablerna i datasetet.
4.3.2 Datahantering
Alla dessa frågor är tydligt utformade efter Likert-skalan med sex stycken svarsalternativ där svarsalternativen om beteende eller kunskap rangordnad i en femgradig skala. Det lägsta svarsalternativet är att svara att något inte är ”inte alls viktigt” för respondenten eller att man har mycket dåliga kunskaper Högsta värdet är att ett beteende är ”mycket viktigt”, eller att ens kunskaper är mycket bra.
Det sjätte svarsalternativet innebär att man kan svara avvikande såsom i att man inte befinner sig i en situation för ett visst beteende eller att man anser sig inte kunna bedöma sin egen kunskap om livsmedelshygien. Dessa observationer som har svarat undfallande har tagits bort för alla variablerna i kategorin (A
1till A
7) för att det intressanta med dessa frågor är då
respondenterna har tagit ett tydligt ställningstagande kring vilka ens attityder är.
Dessa frågor utgör 7 av de 54 variablerna i datasetet. Kvar blir 408 observationer efter att de som har svarat avvikande har tagits bort.
4.4 Kunskapsvariabler
Respondenternas kunskap om livsmedelshygien bedöms utifrån ett 11 stycken Sant/Falskt
frågor (Fråga 4) samt om vad respondenten tror är en korrekt temperatur i ett kylskåp (fråga
18). Dessa frågor utgör variablerna K
1till K
12. Dessa frågor har betraktats som binära och
kodats med 1 då respondenterna svarat rätt svar och med 0 för respondenterna har angivit ett
felaktigt svar eller då man svarat ”Vet ej”. Dessa frågor utgör 12 av de 54 variablerna.
17
5. Resultat
I nedanstående delkapitel kommer resultatet för respektive steg att redovisas och diskuteras.
De resultat som granskas är faktorladdningar, Goodness of fit-värden samt Nested Anova som gåtts igenom i Kapitel 3. Goodness of fit-värdena bedöms utifrån Tabell 1 på sidan 7. Men även kommer resonemangen som förts för att motivera hur man har agerat emellan respektive modell att redovisas. Det vill säga med vilken motivering som den fulla modellen reduceras på variabler i Modell 2 och 3.
5.1 Modell 1: Full modell
Denna modell testar alla variabler som tagits med i denna analys (se bilaga 1). På
faktorladdningarna mellan de latenta variablerna ser vi att det finns en stark positiv koppling mellan respondenternas bakgrund och deras kunskaper inom livsmedelshygien. Ens beteende tenderar att inte påverkar i lika hög utsträckning av kunskapsresultat.
Redovisningen i resultatkapitlet blir framförallt de ”Goodness of fit”-index som används för att bedöma huruvida modellen passar data. P-värde, 𝜒2-test, RMSEA och CFI gås igenom i tabellen nedanför.
Tabell 3: Test av full modell med alla variabler
Antalet fria parametrar 167
Goodness of fit Index Modell Nollmodell
𝜒2-teststatistika 2876.7 10589.5
Frihetsgrader 1270 1 326
P-värde 0,000 0,000
𝜒2-normed 2,265
Robust RMSEA 0,054
Robust CFI 0,827
Vad som kan ses är att även om RMSEA är litet, vilket kan vara beroende av att RMSEA är generösare mot dataset bestående av stickprov med stort antal observationer och med flera variabler. I övrigt är CFI på 0,827 för lågt under det satta gränsvärdet för denna analys.
𝜒2- normed ger ett bra värde på med en ratio på nära 2:1.
𝜒2-normed test tillsammans med
Figur 3: Faktorladdningarna mellan faktorer från den fulla modellen med alla variabler inberäknade
18 RMSEA är två godkända mått, men på grund av för lågt CFI godkänns ej modellen. I bilaga 2 återfinns output från test av den fulla modellen med alla faktorladdningar för respektive indikatorvariabel. Det är utifrån denna output som vilka variabler som tas med i kommande modeller.
5.2 Modell 2: Specifik modell
Med Specifik modell menas den första ”nestade” modell som den fulla modellen kommer att jämföras med i ”Nested Anova”. I denna modell har Institutionen för kostvetenskap varit delaktiga i att genom så kallad face validity sortera ut variabler som inte anses nödvändiga från deras synvinkel att tas med i ett slutgiltigt resultat. Variabel A
5har sållats ut på att den livsmedelshygieniska risken när det gäller hantering av ägg är väldigt liten. De fyra
kunskapsvariabler, K
1, K
5, K
6och K
9har sållats ut då de berör mer generella frågor kring livsmedelshygien. Kvar är således kunskapsfrågor som berör livsmedelshantering framförallt.
En regel som har applicerats i denna analys är att om dessa variabler är under 0,2 i
faktorladdning utesluts de oavsett om de passerat en face validity prövning. Detta förklarar att antalet bakgrundvariabler har minskat från 23 till 8. Bakgrundsvariablerna består i specifika modellen av bakgrund kring hur ofta man hanterar livsmedel, i det här fallet färska grönsaker samt om ens främsta kunskapskälla är ens mor, partner eller media. Dessa har något svagare faktorladdningar, från 0,4 och ned till 0,21. De starkare faktorladdningarna som går mellan 0,6 till 0,99 handlar om huruvida man läst kurs på gymnasiet eller universitet gällande livsmedelshygien och huruvida detta är ens främsta kunskapskälla. Här sticker variablerna B
8och B
16ut då de berör huruvida universitet spelar någon roll i ens bakgrund. Gällande beteendevariablerna så är det bara en variabel som har sållats ut, H
2, som berör hur man gör då man diskar en skärbräda. Denna har sållats ut på grund av att den har en svag
faktorladdning.
Figur 4: Specifika modellen med de variabler och faktorladdningar som beräknats in i modellen.
Grundregeln för denna modell är att ta med de variabler som är intressanta och som går över 0,2 i faktorladdning
19 Den specifika modellen (se bilaga 3) har godtagbara värden som pekar på att det är modell som passar data väl. Detta ses framförallt genom CFI som är över 0,9 vilket utgör. Även RMSEA som påvisar acceptbara värden på 0,06 vilket även håller för de mer konservativa hållning som Hu och Bentler står för. Även 𝜒2 och Normed 𝜒2 påvisar acceptbara siffror då den förstnämnda är under nollmodellens teststatistika och den sistnämnda är under den 3:1- ratio som Hair et al rekommenderar.
Tabell 4: Test av Specifik modell med avgränsat antal variabler
Antalet fria parametrar 167
Goodness of fit Index Modell Nollmodell
𝜒2-teststatistika 1065,0 7421.5
Frihetsgrader 430 465
P-värde 0,000 0,000
𝜒2-normed 2,476
Robust RMSEA 0,060
Robust CFI 0,909
Resultatet talar om att den hypotetiska modell som byggts upp utefter de frågor Hellqvist och Zetterström ställde i sin enkätundersökning, fungerar i ett avgränsat format. Respondenternas bakgrund och då uppbyggt kring huruvida de har studerat livsmedelshygien tenderar att ha en stark positiv påverkan på respondenternas kunskap. Och kunskap i sig har en stark påverkan på respondenternas attityd. Kunskap däremot har en relativt svag påverkan på
respondenternas beteende. Snarare är det respondenternas attityder som påverkar deras beteende.
Tabell 5: Analys av varians för Specifik modell Frihetsgrader
(d.f)
𝜒2-
teststatistika 𝜒2- differens
d.f-
differens Pr(>Chisq)
Modell 2 430 895.00*
Modell 1 1270 2542.2* 1818.3 840 < 2.2e-16
* Notera att
𝜒2värdena inte kommer från den robusta modellen utan från standardmodellen.
I analysen av variansen mellan den fulla modellen och den specifika modellen är det tydligt att dessa två skiljer sig åt och därmed är det rimligt att den senare nämnda modellen, Modell 2: Specifik Modell, tas i beaktning. Särskilt givet att dess Goodness of fit index är godkända enligt de riktlinjer som antagits för denna analys i metodkapitlet.
5.3 Modell 3: Reducerad modell
Den ”reducerade modellen”, den andra ”nestade” modellen som prövas, utgår ifrån samma variabler som den specifika modellen, men skillnaden är att den reducerade modellen
innehåller färre indikatorvariabler för respektive faktor som de laddar emot. De variabler som har sållats ut, har gjorts på två grunder – För det första för att undersöka särskilt kring hur sambanden mellan faktorerna ser ut om man ser enbart på hantering av köttprodukter, nedkylning av livsmedel och respondenternas kunskap.
Detta innebär att variabler inom bakgrundsfaktorn som berör att ens främsta kunskapskälla är
något annat än att man har gått en kurs, har sållats bort. Likaså har variabler som berör
20 handhygien tagits bort från såväl beteende-, kunskap och attityd-faktorerna. Sållningen har även skett med betoning på variabler med svaga faktorladdningar.
Något som kan märkas direkt gällande modellen är att det är ett negativt samband mellan
”Bakgrund” och Kunskap”. Samtidigt är indikatorvariablerna för bakgrund negativa. Detta innebär att om värdet för faktorn ”Bakgrund” går upp, kommer dess indikatorvariabler gå i motsatt riktning. Detta betyder egentligen att om de bakgrundsvariabler som används går upp kommer detta påverka faktorn Bakgrund negativt, men faktorn i sig kommer påverka faktorn Kunskap positivt. Läggs den enligt kriterierna godkända variabeln B
10på analysen så blir faktorladdningen för B
8under minus ett. Detta kan också vara ett tecken på att modell 3 är felspecificerad (se bilaga 4).
Tabell 6: Test av Reducerad modell
Antalet fria parametrar 167
Goodness of fit Index Modell Nollmodell
𝜒2-teststatistika 568,3 5129,4
Frihetsgrader 115 136
P-värde 0,000 0,000
𝜒2-normed 4.942
Robust RMSEA 0,098
Robust CFI 0,909
Felspecificeringen syns även då RMSEA är synnerligen högt medan CFI inte är högre än i den specifika modellen trots att variabler har plockats bort. Detta om man ska gå på Xia och Yangs rekommendationer, som säger att högt RMSEA och lågt CFI är ett tecken på
felspecificerad modell (Xia & Yang, 2019, s 421). Likaså är 𝜒2-normed för högt enligt riktlinjer fastställda av Hair et al. Sammantaget sett med negativa faktorladdningar både för själva parametern mellan faktorn Bakgrund och Kunskap men även i parametrarna mellan
Figur 5: Reducerade modellen med de variabler och faktorladdningar som beräknats in i modellen. Den reducerade modellen tar kunskapsbakgrund, kötthantering och nedkylning i hänsyn.
21 faktorn Bakgrund och dess indikatorvariabler påpekar att något inte fungerar i den reducerade modellen.
Tabell 7: Analys av varians för reducerad modell Frihetsgrader
(d.f)
𝜒2-
teststatistika 𝜒2- differens
d.f-
differens Pr(>Chisq)
Modell 3 115 461.42*
Modell 2 430 895.00* 509.64 315 2.209e-11