• No results found

Kostens inverkan på halten fungicidrester i kroppen : En Bayesiansk multilevelanalys

N/A
N/A
Protected

Academic year: 2021

Share "Kostens inverkan på halten fungicidrester i kroppen : En Bayesiansk multilevelanalys"

Copied!
84
0
0

Loading.... (view fulltext now)

Full text

(1)

Kandidatuppsats i Statistik

Kostens inverkan på halten

fungicidrester i kroppen

En Bayesiansk multilevelanalys

Otto Moen Hanna Skystedt

Avdelningen för Statistik och maskininlärning Institutionen för datavetenskap

Linköpings universitet

(2)

Handledare: Annika Tillander Examinator: Linda Wänström

(3)

Sammanfattning

Idag äter allt fler en mer växtbaserad diet. Samtidigt innehåller växtbaserade produkter oftare resthalter av bekämpningsmedel jämfört med animaliska produkter. Att äta mer växtbaserat kan därför ses som en potentiell hälsorisk. Pilotstudien The Climate Friendly and Ecological Food on Microbiota (CLEAR) un-dersökte 2017 relationen mellan kost och bekämpningsmedel. De 30 deltagarna i studien delades in i en av tre kostgrupper: kontroll, klimatvänlig och ekologisk. Vid tre tillfällen under studiens gång fick deltagarna dels svara på en enkät om bland annat matvanor samt lämna ett urinprov som analyserades för resthalter av fyra bekämpningsmedel. I den här uppsatsen analyseras de två bekämpningsmedelsrester som kopplas till fungicider: propamokarb och etylenthiourea. Dessa summeras till en variabel. Uppsatsen ämnar besvara två frågeställningar: Finns det några skillnader i resthalter av fungicider mellan personer som äter konventionell, klimatvänlig eller ekologisk kost? Hur ser sambandet mellan intag av växtbaserad mat (grönsaker, frukt, spannmål etc.) och resterhalter av fungicider ut? Frågorna har tidigare undersökts av Berg (2018) med en enkel ANOVA-modell respektive korrelationer. Berg fann inga signifikanta skillnader mellan grupperna och inga samband mellan fungicidrester och matintag. I den här uppsatsen används Bayesianska multilevelmo-deller, som anses vara bättre anpassade till strukturen i datamaterialet än de metoder som tidigare används. Resultatet visar att det inte finns några entydiga skillnader i resthalter hos de som tilldelats en konventionell, klimatvänlig respektive ekologisk kost. Det finns inte heller några entydiga samband mellan resthalter och matintag. Posteriorsannolikheter visar dock att det är troligt att resthalterna är mindre i den ekologiska gruppen än i kontrollgruppen. Posteriorsannolikheter visar också på troliga samband mellan resthalter och matgrupperna spannmål och ris, frukt och bär, samt produkterna vin, kaffe och choklad. För att dra några slutsatser behöver vidare studier utföras. Resultaten anses till stor del bero på den stora osäkerheten i da-ta som följer av ett litet urval. De Bayesianska multilevelmodellerna anses dock ge en grundligare bild av sambanden än de metoder som använts tidigare.

(4)

Abstract

Today a growing number of people are transitioning to a more plant based diet. At the same time plant based products often contain higher residue levels of pesticides compared to products derived from animals. Consu-ming more plant based food could therefore be seen as a potential health risk. The pilot study The Climate Friendly and Ecological Food on Microbiota (CLEAR) from 2017 examined the relationship between diet and pesticides. The 30 participants were assigned to one of three groups: control, climate-friendly and ecological. During the study the participants were at three occasions asked to fill in a questionnaire concerning, among other things, eating habits. They were also asked to leave a urine sample, which was analyzed for residues of four pesticides. This thesis analyzed the two pesticide residues associated with fungicides: propamocarb and ethylenethiourea. These two residues were combined to a single variable. The thesis aims to answer the two following questions: Are there any differences in residue levels of fungicides between people who follow a conventional, climate friendly or ecological diet? What is the relationship between the consumption of plant based food (vegetables, fruit, cereals etc.) and residue levels of fungicides? These questions were previously explored by Berg (2018) with an ANOVA-model and by examining correlations. Berg found no significant differences between the groups and no strong correlations between residues of fungicides and food intake. In this thesis we instead attempt to answer the questions using Bayesian multilevel models, which are more suited to the structure of the data compared to methods that have been used previously. The analysis shows that there are no differences in residue levels between those who were prescribed a conventional, climate friendly or ecological diet. There are also no unequivocal relationships between residue levels and food intake. However, posterior probabilities show that it is likely that the residue levels are lower for the ecological group compared to the control group. Posterior probabilities also show that there are some more likely relationships for the food groups cereals and rice, fruits and berries, as well as for the products wine, coffee and chocolate. To reach any conclusions regarding these relationships further studies are required. The results in this thesis are to a large degree deemed to depend on the uncertainty that follows from a small sample size. The Bayesian multilevel models have however given a more thorough understanding of the relationships than was achieved with previously used methods.

(5)

Innehåll

1 Inledning 1

1.1 Bekämpningsmedel i ekologisk och konventionell kost . . . 2

1.2 Syfte och frågeställningar . . . 3

1.3 Etiska och samhälleliga aspekter . . . 3

2 Data 5 2.1 Responsvariabel: resthalter av fungicider . . . 6

2.2 Matintag . . . 7

2.3 Mängd ekologisk mat . . . 11

2.4 Bortfall och ofullständiga enkätsvar . . . 13

3 Metod 14 3.1 Kort om Bayesiansk statistik . . . 14

3.2 Inferens i Bayesiansk analys . . . 15

3.3 Bayesiansk multilevelmodell . . . 16

3.4 Val av likelihood och priorfördelning . . . 19

3.5 Anpassning av modell - Markov Chain Monte Carlo . . . 20

3.6 Modellutvärdering . . . 22

4 Resultat 24 4.1 Resthalter av fungicider i de tre kostgrupperna . . . 24

4.2 Samband mellan resthalter av fungicider och matintag . . . 28

4.2.1 Grönsaker och rotfrukter . . . 31

4.2.2 Frukt och bär . . . 33

4.2.3 Spannmål och ris . . . 35

4.2.4 Vin . . . 36

4.2.5 Kaffe . . . 37

4.2.6 Choklad . . . 38

4.2.7 Frukt- och spannmålsdrycker samt frön och nötter . . . 39

5 Diskussion 41 5.1 Utvärdering av metodvalet . . . 41

5.2 Effekter av databearbetningen . . . 42

5.3 Diskussion kring resultatet . . . 42

6 Slutsatser 45

Litteraturförteckning 46

Bilaga A: Webbenkät från CLEAR Bilaga B: R-kod för modellering

(6)

Figurer

2.1 Översikt över CLEAR-studiens genomförande. . . 5

2.2 Halt fungicidrester (µg/g kreatin) vid per grupp och mättillfälle. . . 6

2.3 Daglig konsumtion av grönsaker och rotfrukter per grupp och mättillfälle. . . 10

2.4 Daglig konsumtion av frukt och bär per grupp och mättillfälle . . . 10

2.5 Daglig konsumtion av spannmål och ris per grupp och mättillfälle. . . 10

2.6 Konsumtion av ekologiska grönsaker och rotfrukter per grupp och mättillfälle. . . 11

2.7 Konsumtion av ekologisk frukt per grupp och mättillfälle. . . 12

2.8 Konsumtion av ekologiska spannmålsprodukter per grupp och mättillfälle. . . 12

2.9 Konsumtion av ekologiskt vin per grupp och mättillfälle. . . 12

4.1 Map-skattning och 90 procent kredibilitetsband enligt modell 4.1, per kostgrupp. . . 26

4.2 Modellering av kontrollgruppen utan extremvärde. . . 27

4.3 Posteriorfördelningar för effekt hos klimat- och ekogruppen. . . 28

4.4 Känslighetsanalys för β1 i modellen för grönsaker och rotfrukter . . . 30

4.5 Känslighetsanalys för β3 i modellen för frukt och bär . . . 31

4.6 Map-linjer med 90 procent kredibilitetsband för grönsaker och rotfrukter. . . 32

4.7 Posteriorfördelningar för lutningsparametrar för grönsaker och rotfrukter. . . 33

4.8 Map-linjer med 90 procent kredibilitetsband för frukt och bär. . . 34

4.9 Posteriorfördelningar för lutningsparametrar för frukt och bär. . . 34

4.10 Map-linje med 90 procent kredibilitetsband för spannmål och ris. . . 35

4.11 Map-linjer med 90 procent kredibilitetsband för grönsaker och rotfrukter. . . 36

4.12 Posteriorfördelningar för lutningsparametrar för vin. . . 37

4.13 Map-linje med 90 procent kredibilitetsband för kaffe. . . 38

4.14 Map-linje med 90 procent kredibilitetsband för choklad. . . 39

(7)

Tabeller

2.1 Påhittad exempeldata för några matprodukter. . . 7 2.2 Påhittad exempeldata för några matprodukter efter bearbetning. . . 8 2.3 Gruppering av matprodukter, grönsaker, rotfrukter, frukt och bär. . . 8 2.4 Gruppering av matprodukter, spannmål, ris, frukt, nötter samt produkter som exkluderas. . . 9 2.5 Gruppering av dryckesprodukter och övriga produkter. . . 9 4.1 Känslighetsanalys av modell 4.1. . . 25

(8)

1.

Inledning

Klimatförändringarna är en av vår tids största utmaningar och ställer krav på förändrade levnadsvanor. En stor aspekt är den mat vi konsumerar, där allt större vikt läggs på att skifta konsumtionen från animaliska produkter till en mer växtbaserad diet. Studier visar att konsumtionen av frukt och grönsaker i Sverige har ökat de senaste decennierna (Amcoff et al. 2012; Eidstedt, Wixe & Holmer, 2015; Vereecken et al. 2015). Ex-empelvis visade Eidstedt et al. (2015) att konsumtionen per capita av frukt ökade med 26 procent i Sverige under perioden 1980-2015. Under samma period ökade konsumtionen av växter som används vid matlagning, såsom grönsaker, rotfrukter och kryddväxter, med 98 procent.

Samtidigt som en sådan ökning för med sig många positiva effekter som minskade koldioxidutsläpp (Ranga-nathan et al., 2016), ökad livslängd och minskad risk för cancer (Oyebode, Gordon-Dseagu, Walker & Mindell, 2014) så innehåller frukt och grönsaker oftare resthalter av bekämpningsmedel jämfört med animaliska pro-dukter. European Food Safety Authority undersökte nivåerna av bekämpningsmedel i en mängd produkter på den europeiska marknaden 2016 och fann att det för animaliska produkter endast fanns resthalter av 11 utav 22 undersökta bekämpningsmedel (EFSA, 2018). Ett flertal av dessa 11 bekämpningsmedel är redan förbjudna och används inte längre, utan resthalterna finns endast kvar som en följd av att medlen bryts ner långsamt. Bland växtbaserade produkter upptäcktes 129 resthalter från 157 undersökta bekämpningsmedel. Fler växtbaserade produkter hade även resthalter över de lagliga nivåerna jämfört med de animaliska pro-dukterna.

Den ökande konsumtionen av frukt och grönsaker kan därför ses som en potentiell hälsorisk. Tidigare studier på grisar och möss har visat att olika sorters bekämpningsmedel bland annat kan påverka hanars reproduk-tionsförmåga (Torner et al. 1999; Sørensen & Danielsen, 2006), störa ämnesomsättningen (Wu et al. 2018) och resultera i funktionsnedsättningar (Zhang et al. 2018). Exempelvis fann Torner et al. (1999) att mushanar som fått mat och vatten behandlat med bekämpningsmedlet klormekvat hade sämre fertilitet.

Bekämpningsmedel är ett samlingsnamn för en stor mängd ämnen som på olika sätt används vid matproduk-tion, exempelvis för skydd mot angrepp eller för att öka storleken på skörden. En grupp av bekämpningsmedel kan benämnas fungicider; medel som används mot svampangrepp. En sådan fungicid är propamokarb, som i Sverige används på bland annat sallat, gurka och potatis (Jansson, Fohgelberg & Widenfalk, 2016). Vid analys av fungicider i kroppen är det även vanligt att observera ämnet etylenthiourea, som är en nedbryt-ningsprodukt från flera olika fungicider (International Agency for Research on Cancer Working Group on the Evaluation of Carcinogenic Risk to Humans IARC, 2001).

(9)

1.1

Bekämpningsmedel i ekologisk och konventionell kost

Bekämpningsmedlens relation till kosten undersöktes 2017 i pilotstudien The Climate Friendly and Ecological Food on Microbiota (CLEAR). CLEAR var en åtta veckor lång interventionsstudie där deltagarna uppmunt-rades att följa en av tre dieter. En kontrollgrupp uppmuntuppmunt-rades att äta en konventionell, hälsosam diet baserad på Livsmedelsverkets kostrekommendationer. En andra grupp fick instruktioner om att äta klimatvänligt med fokus på växtbaserade produkter och den tredje gruppen instruerades att äta mer ekologiskt. Interventionen skedde genom informationsföreläsningar om respektive kost vid studiens början samt efter två, fyra och sex veckor. Det fanns inga krav på hur mycket av den tilldelade kosten deltagarna skulle äta. Deltagarna fick vid tre tillfällen; vid studiens början, efter fyra veckor och efter åtta veckor, svara på en webbenkät om bland annat deras matvanor och konsumtion av ekologisk mat. De fick också lämna urinprover som analyserades för halter av de fyra bekämpningsmedlen propamokarb, etylenthiourea, mepikvat och klormekvat. Totalt deltog 30 personer i studien.

Berg (2018) analyserade de insamlade resultaten från CLEAR-studien med en ANOVA-modell men fann inga signifikanta skillnader mellan de tre grupperna med avseende på hur resthalterna förändrades under studiens gång. För klimatgruppen observerades dock tre signifikanta korrelationer mellan en viss mattyp och något bekämpningsmedel. De tre korrelationerna var mellan majs och mepikvat, mellan matgruppen gröna ärtor och gröna bönor och medlen mepikvat respektive klormekvat.

De senaste åren har flera pilotstudier med liknande syfte som CLEAR genomförts (Oates, Cohen, Braun, Schembri & Taskova 2014; Magnér, Wallberg, Sandberg & Palm Cousins 2015; Göen, Schmidt, Lichtenstei-ger & Schlumpf 2017) där resthalter av olika bekämpningsmedel i urin mätts efter att deltagarna ätit efter olika instruktioner. Till skillnad från resultatet av Berg (2018) har dessa studier funnit att resthalterna av bekämpningsmedel förändras vid ett byte av kost.

Oates et al. (2014) mätte resthalter av pesticider av typen organofosfater hos 13 vuxna personer i Austra-lien som slumpmässigt delades in i två grupper. De två grupperna fick äta 80 procent ekologiskt respektive konventionellt odlad mat under en vecka för att sedan byta roller under ytterligare en vecka. Resthalterna av pesticiderna var signifikant mindre för de som åt ekologiskt.

I en annan pilotstudie undersökte Magnér et al. (2015) resthalter av ett flertal bekämpningsmedel, bland annat de fyra som mättes i CLEAR, hos en svensk familj bestående av två vuxna och tre barn. Familjen åt först konventionellt odlad mat under en vecka och sedan endast ekologiskt under två veckor. Under de tre veckorna lämnade familjemedlemmarna ett urinprov varje morgon. Fyra urinprov per person från varje period valdes sedan ut för analys. När familjen gick över till en ekologisk diet minskade resterna av bekämp-ningsmedel överlag, där resterna minskade mer för barnen än för de vuxna. Exempelvis minskade halten av mepikvat mindre för de vuxna än för barnen. De matdagböcker som deltagarna skrev under studien pekar på att detta var en följd av konsumtion av kaffe, trots att kaffet var ekologiskt.

Även Göen et al. (2017) observerade lägre resthalter av ett flertal bekämpningsmedel hos personer som ätit ekologisk kost jämfört med personer som ätit konventionellt. Studien mätte olika pesticider, insekticider och herbicider i urinen hos två vuxna personer i Schweiz. Deltagarna fick först äta en konventionell diet under 11 dagar och urinprover togs på morgonen av de sista fyra dagarna av perioden. Efter detta fick deltagarna äta en exklusivt ekologisk diet under 18 dagar och prover togs återigen på morgonen av de sista fyra dagarna

(10)

av perioden. Överlag var resterna lägre under den ekologiska perioden för båda individerna, dock hade en individ högre värden för två sorters bekämpningsmedel.

Gemensamt för dessa studier är att de statistiska metoder som använts för att analysera resultatet är relativt enkla. Oates et al. (2014) använde sig av ett Wilcoxon-test för att säkerställa skillnader mellan grupper, Göen et al. (2017) använde t-test och Magnér et al. (2017) genomförde inga tester utan presenterade endast mätvärdena. Ur ett statistiskt perspektiv är det därför intressant att undersöka ämnet med metodik som är bättre anpassad för studier som följer samma individer över tid.

1.2

Syfte och frågeställningar

Syftet med den här uppsatsen är att undersöka sambandet mellan kost och rester av bekämpningsmedel. Uppsatsen ämnar dels att undersöka skillnader i resthalter mellan konventionell, klimatvänlig och ekologisk kost och dels att analysera eventuella samband mellan rester av bekämpningsmedel och det specifika matin-taget.

Pilotstudien CLEAR syftade delvis till att besvara dessa frågor. De tidigare analyserna av Berg (2018) visade inte på några statistiskt signifikanta skillnader, men det lilla stickprovet innebär att det är svårt att visa på signifikanta resultat, även om sådana finns i populationen. Därför ämnar den här uppsatsen att gå vidare genom att använda statistisk metodik som bättre kan hantera utmaningarna med små longitudinella studier. CLEAR-studien mätte halterna av propamokarb, etylenthiourea, mepikvat och klormekvat. I den här upp-satsen kommer endast de två fungicidresterna propamokarb och etylenthiourea att undersökas. Dessa är för-knippade med växtbaserade produkter och därför exkluderas animaliska produkter från analysen av matintag. Specifikt ämnar uppsatsen besvara följande frågeställningar:

• Finns det några skillnader i resthalter av fungicider mellan personer som tilldelats en konventionell, klimatvänlig eller ekologisk kost?

• Hur ser sambandet ut mellan resthalter av fungicider och vilken mat deltagarna har ätit?

1.3

Etiska och samhälleliga aspekter

En etisk aspekt för denna uppsats är genomförandet av den studie som samlat in det datamaterial som används. Deltagande i studien var frivilligt och personerna hade möjlighet att hoppa av närsomhelst un-der studiens gång. Det var även upp till deltagarna själva hur strikt de skulle följa den kostgrupp de blivit placerade i. Studien borde därför inte ha inneburit någon stor ekonomisk press för deltagarna. Slutligen fick deltagarna i studien ett ID-nummer och efter detta togs personlig information bort för att skydda deltagarnas identiteter.

(11)

En andra etisk aspekt är hur datamaterialet hanteras vid skrivandet av uppsatsen, där målet är att det inte ska gå att röja någon av deltagarnas identitet. För att bevara anonymiteten tas särskild hänsyn för att fastställa att enskilda beskrivningar inte kan kopplas ihop så att enskilda individer identifieras.

Den nytta som denna uppsats kan tillföra samhället är främst att undersöka om det är lämpligt att analysera resultat från liknande studier med den valda metodiken. Tidigare studier har använt metoder som inte är specifikt anpassade till den longitudinella strukturen hos datamaterialet. Den här uppsatsen kan förhopp-ningsvis lägga en grund för hur metoder som är ovanliga inom fältet, men som tar hänsyn till datamaterialets struktur, kan användas i framtiden. Då datamaterialet kommer från en pilotstudie bör resultatet i den här uppsatsen endast användas för att se vad som kan vara intressant att undersöka vidare vid framtida studier då urvalet är större och mer representativt.

(12)

2.

Data

De delar av CLEAR-studien som kommer användas i denna uppsats består dels av analysresultaten av urin-prover och dels av svar från enkätfrågor om deltagarnas matvanor. Deltagarna i CLEAR rekryterades från två huvudsakliga grupper. Den ena gruppen var personer som samtidigt deltog i en större svensk hälsostudie, LifeGene, och hade meddelat att de var intresserade av att delta i framtida forskning. Den andra gruppen var studenter och anställda vid Mälardalens Högskola. Grupperna blev även tillfrågade att bjuda in vänner och familj att delta i studien. Samtliga deltagare var i åldrarna 20–55 år och från Västerås. Ett krav var att deltagarna skulle följa en allätande kost.

Vid studiens början deltog 30 personer som slumpmässigt delades in i tre grupper: en grupp som skulle äta enligt Livsmedelsverkets kostrekommendationer och som agerar kontrollgrupp, en grupp som uppmanades att äta klimatvänligt samt en grupp som uppmanades att äta ekologiskt. Kvinnor och män randomiserades separat. Vid det första mättillfället hade en person lämnat studien. Det ingick då tio personer i kontroll-gruppen, nio i klimatgruppen och tio i den ekologiska gruppen. Vid den andra mätningen hade en person från kontrollgruppen och en från den ekologiska gruppen lämnat studien. Till den tredje mätningen avbröt ytterligare en person från klimatgruppen. Vid den tredje och sista mätningen återstod alltså nio personer i kontrollgruppen, åtta i klimatgruppen och nio i den ekologiska gruppen. Processen sammanfattas i figur 2.1.

Randomisering av 30 deltagare Klimatgrupp n=9 Kontrollgrupp n=10 Ekologisk grupp n=10 Kontrollgrupp n=9 Kontrollgrupp n=9 Klimatgrupp n=9 Klimatgrupp n=8 Ekologisk grupp n=9 Ekologisk grupp n=9 • Ett avhopp

• 19 kvinnor och 9 män vid första

mättillfället.

Ett avhopp Ett avhopp

Ett avhopp Mättillfälle 1

Mättillfälle 2

Mättillfälle 3

(13)

Vid varje mättillfälle lämnade deltagarna urinprov som analyserades för resthalter av bekämpningsmedlen propamokarb, etylentiourea, mepikvat och klormekvat. För att kontrollera för olika provers urinkoncentration mäts resthalten i mikrogram pesticid per gram kreatin (Berg 2018). Deltagarna fyllde även i en enkät om matvanor. Det första mättillfället skedde innan deltagarna tilldelades kostgrupper och fungerar därför som baseline för varje grupp.

2.1

Responsvariabel: resthalter av fungicider

En responsvariabel skapas genom att resterna för propamokarb och etylenthiourea summeras till en varia-bel som benämns fungicider. Resthalterna av fungicider vid varje mättillfälle och för respektive kostgrupp presenteras i figur 2.2. De flesta uppmätta halter av fungicidrester är små men det finns ett flertal mät-ningar med högre halter i kontroll- och klimatgruppen. I kontrollgruppen finns särskilt en uteliggande halt vid tredje mättillfället. Uteliggaren har markerats särskilt och sänkts till 2 µg/g kreatin för att underlätta visualiseringen. Den faktiska halten är 3,2 µg/g kreatin. Det finns inga uppenbara skillnader mellan de tre kostgrupperna. I kontrollgruppen och klimatgruppen syns ingen tydlig förändring under studiens gång. I den ekologiska gruppen finns det däremot något färre deltagare med höga resthalter vid de senare mättillfällena.

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 1 2 3 Mättillfälle

Halt fungicidrester hos kontrollgruppen

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 1 2 3 Mättillfälle

Halt fungicidrester hos klimatgruppen

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 1 2 3 Mättillfälle

Halt fungicidrester hos ekologiska gruppen

Figur 2.2: Halt fungicidrester (µg/g kreatin) i urinprover vid de tre mättillfällena, med kontrollgruppen överst till vänster, klimatgruppen överst till höger och den ekologiska gruppen underst.

(14)

2.2

Matintag

Ett antal kostvariabler skapas utifrån enkätfrågor om deltagarnas matvanor. Frågorna är baserade på enkäten Meal-Q, som visats vara en enkät som är både lätt att besvara och ger en bra uppskattning av faktiskt matin-tag (Christensen et al. 2013). I enkäten är olika produkter organiserade i matgrupper, exempelvis drycker, frukter, fisk- och skaldjursrätter. Deltagarna fick kryssa i en ruta för hur ofta de åt en viss produkt. Den lägre gränsen för att kryssa i en ruta var att personen åt produkten en gång i månaden. Vissa grupper hade nio svarsalternativ; från 5 ggr/dag eller oftare till 1–3 ggr/månad, medan andra hade fem; från 7 ggr/vecka eller oftare till 1–3 ggr/månad. När det gäller deltagarnas alkoholvanor var produkterna grupperade på ett liknande sätt för öl, cider och vin. Svarsalternativen formulerades som antalet flaskor eller burkar per månad. De delar av enkäten som används i uppsatsen återfinns i bilaga A.

Ett exempeldata med påhittade värden presenteras i tabell 2.1. Exemplet visar en produkt med nio svars-alternativ (kaffe), en med fem svars-alternativ (majs) samt en alkoholprodukt (folköl) med sju svarssvars-alternativ. Observera värdet −111 som också förekommer i det faktiska datamaterialet. Värdet innebär att deltagaren inte svarat på frågan. I enkäten uppmanades deltagaren att endast besvara en fråga om deltagaren konsu-merade produkten minst en gång i månaden. Därför görs antagandet att deltagare som inte besvarat frågan inte heller konsumerar produkten och konsumtionen antas vara 0.

Tabell 2.1: Påhittad exempeldata för några matprodukter. ID Kaffe per dag Majs per vecka Folköl per månad

01 1 2

02 -111 4 2

03 2 1 -111

04 9 5 7

För att förenkla tolkningarna och för att möjliggöra hopslagningar av variabler transformeras samtliga vari-abler så att attributvärdena blir antalet gånger per dag som en produkt konsumeras. Ett antal svarsalternativ är från början uttryckta i antal gånger per dag, så i dessa fall kan svarsalternativet direkt ersättas med det värde som representeras. I fall där alternativet är uttryckt som ett intervall antas frekvensen vara i mit-ten av intervallet. Svarsalternativet 1-3 ggr/månad sätts exempelvis till 2 ggr/månad och räknas om till 2/30 ≈ 0, 067 ggr/dag.

Processen illustreras genom att exempeldata i tabell 2.1 bearbetas och resultatet presenteras i tabell 2.2. De kategoriska variablerna har kodats om till daglig konsumtion. För variablerna som berör alkoholkonsumtion finns utöver −111-värden även tomma celler. Dessa tomma celler är en följd av att deltagarna först fick en fråga om vilka alkoholtyper de konsumerar varje månad, exempelvis öl eller cider. Om en deltagare på denna fråga svarar att de inte konsumerar en viss typ av alkohol så har de inte fått följdfrågan om hur ofta de konsumerar olika produkter av denna typ. Utifrån denna information kodas även de tomma cellerna om till 0, vilket markerats med fetstil i tabell 2.2. Det finns även en deltagare som vid det första mättillfället svarade “vet ej” på konsumtionen av stark cider. Då konsumtionen av stark cider överlag är väldigt låg (77 av 82 observationer är 0) och då deltagaren även svarat att den inte konsumerar stark cider vid de två övriga mättillfällena, sätter vi även detta värde till 0.

(15)

Tabell 2.2: Påhittad exempeldata för några matprodukter efter bearbetning. ID Kaffe per dag Majs per dag Folköl per dag

01 5 0,786 0

02 0 0,214 0,167

03 4 1 0

04 0,067 0,067 0,633

När alla variabler har bearbetats om till konsumtion per dag bildas nya variabler som kombinationer av de ursprungliga. De nya variablerna skapas genom att summera de variabler som tillhör en naturlig grupp så att de nya kan tolkas som ett mått på daglig konsumtion av produkter inom denna grupp. Utifrån avgränsningen om att de produkter som helt är från animaliskt ursprung exkluderas så delas produkterna in i fyra grupper: grönsaker och rotfrukter, frukt och bär, spannmål och ris, frön och nötter. Grupperna och de produkter de består av presenteras i tabell 2.3 och 2.4.

Tabell 2.3: Gruppering av matprodukter från enkäten som främst innehåller grönsaker och rotfrukter, frukt och bär.

Grönsaker och rotfrukter Frukt och bär Grönsaksblandning, t.ex. wok Banan

Tomat, paprika Äpple, päron

Salladsblad, gurka Apelsin, småcitrus, grapefrukt

Spenat, rucola Annan frukt

Lök, purjolök, vitlök Färska eller frysta bär

Morot Torkad frukt och bär

Majs Marmelad, sylt

Popcorn Avokado

Broccoli, brysselkål, salladskål Gröna ärter, gröna bönor

Rödbeta, palsternacka, kålrot, rotselleri Oliv

Bönor, linser, kikärter, hummus Vegetarisk grönsaksrätt

Vegetarisk proteinrik rätt Salladsrätt

Kokt potatis, potatismos Pommes frites, stekt potatis Chips, ostbågar

(16)

Tabell 2.4: Gruppering av matprodukter från enkäten som främst innehåller spannmål och ris, frön och nötter samt produkter som ej tas med i analysen.

Spannmål och ris Frön och nötter Exkluderade produkter

Vitt bröd Linfrö Hamburgare, kebab, tacos

Grovt mjukt bröd Nötter, mandlar, frön Köttfärsrätter

Hårt bröd Konditoribit, tårta, dessertpaj

Müsli, flingor Godis

Havregrynsgröt Pizza, paj, pirog

Vit pasta Fylld baguette, smörgås, wrap

Fullkornspasta Soppa

Ris Råris

Couscous, bulgur, quinoa Kex, skorpor, kakor Bulle, muffin, mjuk kaka Pannkakor, plättar, våfflor

När det gäller några produkter finns oklarheter om vilken grupp de bör placeras i. Exempelvis kan hambur-gare, kebab, tacos tillagas på olika sätt och kan, beroende på variant, bestå av mest kött, av mest bröd eller av mest grönsaker. Liknande problem existerar för produkterna pizza, paj, pirog, för fylld baguette, smör-gås, wrap samt för köttfärsrätter och soppa. Dessa produkter exkluderas därför från analysen. Med liknande resonemang exkluderas även produkterna konditoribit, tårta, dessertpaj och godis. Det finns även ett antal produkter av typen drycker. Dessa delas in i två grupper: spannmålsbaserade och frukt- och bärbaserade drycker. Slutligen finns tre produkter som vi väljer att inte kombinera med några andra: vin, kaffe och cho-klad, eftersom tidigare studier visat att dessa produkter är särskilt intressanta.

Tabell 2.5: Gruppering av dryckesprodukter och övriga produkter.

Spannmålsbaserade drycker Frukt- och bärbaserade drycker Enskilda produkter

Folköl Juice Vin

Mellanöl Fruktdryck Kaffe

Stark öl Läsk, cider, saft Choklad

Extra stark öl Cider, alkoläsk

Havredryck Stark cider

Sojadryck

Tre av de skapade gruppvariablerna; grönsaker och rotfrukter, frukt och bär, samt spannmål och ris, visu-aliseras i figur 2.3-2.5. Samtliga figurer visar att det inte skett någon tydlig förändring i matintaget inom grupperna under studiens gång. Det är särskilt anmärkningsvärt hos deltagarna i klimatgruppen eftersom de uppmanades att äta en mer växtbaserad kost. Det syns inte heller någon tydlig skillnad i matintaget mellan de tre kostgrupperna.

(17)

0 1 2 3 4 5 6 7 8 9 10 1 2 3 Mättillfälle

Konsumtion av grönsaker, kontrollgrupp

0 1 2 3 4 5 6 7 8 9 10 1 2 3 Mättillfälle

Konsumtion av grönsaker, klimatgrupp

0 1 2 3 4 5 6 7 8 9 10 1 2 3 Mättillfälle

Konsumtion av grönsaker, ekologisk grupp

Figur 2.3: Daglig konsumtion av grönsaker och rotfrukter vid de tre mättillfällena. För kontrollgruppen till vänster, klimatgruppen i mitten och den ekologiska gruppen till höger.

0 1 2 3 4 5 6 7 8 9 10 1 2 3 Mättillfälle

Konsumtion av frukt, kontrollgrupp

0 1 2 3 4 5 6 7 8 9 10 1 2 3 Mättillfälle

Konsumtion av frukt, klimatgrupp

0 1 2 3 4 5 6 7 8 9 10 1 2 3 Mättillfälle

Konsumtion av frukt, ekologisk grupp

Figur 2.4: Daglig konsumtion av frukt och bär vid de tre mättillfällena. För kontrollgruppen till vänster, klimatgruppen i mitten och den ekologiska gruppen till höger.

0 1 2 3 4 5 6 7 8 9 10 1 2 3 Mättillfälle

Konsumtion av spannmål, kontrollgrupp

0 1 2 3 4 5 6 7 8 9 10 1 2 3 Mättillfälle

Konsumtion av spannmål, klimatgrupp

0 1 2 3 4 5 6 7 8 9 10 1 2 3 Mättillfälle

Konsumtion av spannmål, ekologisk grupp

Figur 2.5: Daglig konsumtion av spannmål och ris vid de tre mättillfällena. För kontrollgruppen till vänster, klimatgruppen i mitten och den ekologiska gruppen till höger.

(18)

2.3

Mängd ekologisk mat

En andra del i enkäten behandlade konsumtion av ekologisk mat. Deltagarna fick först en övergripande fråga om vilka mattyper de brukar äta ekologiskt. För de mattyper som deltagarna svarade att de brukar äta ekologiskt kom sedan följdfrågor om hur stor andel av konsumtionen av denna mattyp som är ekologisk. För dessa frågor fanns fem svarsalternativ: 0%, 25%, 50%, 75% och 100%.

Svaren på frågorna om andelen ekologisk mat sammanfattas med fyra variabler: en för grönsaker och rot-frukter, en för frukt, en för spannmål och en för vin. Den ekologiska variabeln för grönsaker skapas som en sammanvägning av två frågor: andelen rotfrukter och andelen grönsaker. Ett poäng beräknas genom att svaret på frågan (kodat 1–5) viktas med hur stor andel rotfrukter deltagaren äter av den totala mängden grönsaker och rotfrukter. Vikterna för rotfrukter och grönsaker summerar alltså till ett. Baserat på poängen skapas en kategorisk variabel med värdet inget om poängen motsvarar inget ekologiskt, lite om poängen mot-svarar hälften eller mindre ekologiskt och mycket om mer än hälften är ekologiskt. På liknande sätt skapas en variabel för frukt baserat på en sammanvägning av äpplen och päron, bananer, citrus och övrig färsk frukt. Den tredje och fjärde variabeln, för spannmål och vin, skapas direkt från frågor om hur stor andel spannmål respektive vin deltagaren konsumerar ekologisk.

Dessa variabler visualiseras i figur 2.6-2.9. När det gäller kontrollgruppen och klimatgruppen ser inte mäng-den ekologisk mat ut att förändras mycket under studiens gång, vilket var att vänta då personerna i dessa grupper inte fick några instruktioner om att äta mer eller mindre ekologisk mat. I den ekologiska gruppen kan mängden ekologiska grönsaker och mängden ekologiskt vin ha ändrats något, medan mängden ekologisk frukt respektive spannmål verkar vara oförändrad. Observera att ingen deltagare har ätit lite ekologisk frukt, utan samtliga deltagare har ätit antingen ingen eller mycket ekologisk frukt.

0 2 4 6 8 1 2 3 Mättillfälle Antal deltagare

Mängd ekologiska grönsaker, kontrollgrupp

0 2 4 6 8 1 2 3 Mättillfälle Antal deltagare

Mängd ekologiska grönsaker, klimatgrupp

0 2 4 6 8 1 2 3 Mättillfälle Antal deltagare Ingen Liten Mycket Mängd ekologiska grönsaker, ekologisk grupp

Figur 2.6: Konsumtion av ekologiska grönsaker och rotfrukter vid de tre mättillfällena. För kontrollgruppen till vänster, klimatgruppen i mitten och den ekologiska gruppen till höger.

(19)

2 4 6 8 10 1 2 3 Mättillfälle Antal deltagare

Mängd ekologisk frukt, kontrollgrupp

2 4 6 8 1 2 3 Mättillfälle Antal deltagare

Mängd ekologiskt vin, klimatgrupp

2 4 6 8 10 1 2 3 Mättillfälle Antal deltagare Ingen Mycket Mängd ekologisk frukt, ekologisk grupp

Figur 2.7: Konsumtion av ekologisk frukt vid de tre mättillfällena. För kontrollgruppen till vänster, klimat-gruppen i mitten och den ekologiska klimat-gruppen till höger.

2 4 6 8 10 1 2 3 Mättillfälle Antal deltagare

Mängd ekologiskt spannmål, kontrollgrupp

2 4 6 8 10 1 2 3 Mättillfälle Antal deltagare

Mängd ekologiskt spannmål, klimatgrupp

2 4 6 8 10 1 2 3 Mättillfälle Antal deltagare Ingen Liten Mycket Mängd ekologiskt spannmål, ekologisk grupp

Figur 2.8: Konsumtion av ekologiska spannmålsprodukter vid de tre mättillfällena. För kontrollgruppen till vänster, klimatgruppen i mitten och den ekologiska gruppen till höger.

2 4 6 8 1 2 3 Mättillfälle Antal deltagare

Andel ekologiskt vin, kontrollgrupp

2 4 6 8 1 2 3 Mättillfälle Antal deltagare

Mängd ekologiskt vin, kontrollgrupp

2 4 6 8 1 2 3 Mättillfälle Antal deltagare Ingen Liten Mycket Mängd ekologiskt vin, ekologisk grupp

Figur 2.9: Konsumtion av ekologiskt vin vid de tre mättillfällena. För kontrollgruppen till vänster, klimat-gruppen i mitten och den ekologiska klimat-gruppen till höger.

(20)

2.4

Bortfall och ofullständiga enkätsvar

I datamaterialet finns ett fullständigt bortfall. En deltagare hoppade av vid första tillfället efter att ha be-svarat enkäten men utan att ha lämnat några urinprover. Utan värden på dessa prover anses inte denna observation vara av intresse för uppsatsen och tas därför bort. Det finns även tre bortfall under studiens gång. En deltagare lämnade studien under första tillfället, men besvarade enkäten och lämnade prover. Då de viktigaste aspekterna; matvanor och resthalter av bekämpningsmedel, finns med så behålls denna obser-vation. Dock saknas information om vilken grupp personen tillhörde, men eftersom det första mättillfället skedde innan indelningen i kostgrupper kan deltagaren antas ha följt en konventionell kost. Observationen placeras därför i kontrollgruppen. Det andra bortfallet uppstod efter det första mättillfället och det tredje bortfallet efter det andra mättillfället. För dessa deltagare finns komplett information gällande mättillfällena innan bortfallet. Dessa observationer kan därför inkluderas utan problem.

(21)

3.

Metod

Analysen kommer utföras med Bayesianska multilevelmodeller. Valet av metod utgår från strukturen i da-tamaterialet, som är longitudinellt och obalanserat. Det är longitudinellt eftersom studien följer samma individer över tid, specifikt vid tre tillfällen. Dessutom är det obalanserat eftersom det är olika antal del-tagare vid varje mättillfälle på grund av bortfall. Multilevelmodeller är väl anpassade för den här typen av data (Goldstein, 1999). Multilevelmodellen får sitt namn för att den innehåller flera nivåer, där varje nivå motsvarar en gruppering i datamaterialet. I det här fallet utgör tidpunkterna en första nivå och individerna en andra nivå. Multilevelmodeller kan också hantera obalanserade data utan problem.

En ytterligare utmaning är det få antalet observationer. Det sätter en begränsning på hur många parametrar en modell kan ha utan att bli överanpassad. Med Bayesiansk metodik är överanpassning ett mindre problem eftersom risken för överanpassning kan minskas genom valet av priorfördelning (McElreath, 2016). Få ob-servationer innebär också en stor osäkerhet i analysen. Med en frekventistisk analys kan det innebära att det blir svårt att dra några slutsatser eftersom alla parametrar riskerar bli icke-signifikanta. Det Bayesianska perspektivet ger däremot en helhetsbild av osäkerheten genom posteriorfördelningen. Det innebär att indika-tioner om hur sannolikt det är att parametrar antar intressanta värden kan bestämmas även om effekterna inte är helt entydiga. Därför väljer vi ett Bayesianskt angreppssätt.

3.1

Kort om Bayesiansk statistik

Inom traditionell, frekventistisk, statistik anses parametrarna för en population ha fixa värden. Då statistiker sällan har tillgång till information om en hel population, utan endast ett stickprov, ses parametrarna för stickprovet som skattningar av de sanna populationsparametrarna (McElreath, 2016). Inom Bayesiansk sta-tistik antas istället ett probabilistiskt synsätt, där parametrarna får en sannolikhetsfördelning som beskriver hur troligt det är att de antar olika värden. För att kunna ta fram denna fördelning behövs två komponenter: likelihood och priorfördelning.

Likelihooden modellerar informationen från data. Den är en funktion som beskriver hur troligt det är att data ser ut som det gör givet olika värden på parametrarna θ. θ kan anta alla värden som är möjliga för den givna parametern, exempelvis alla positiva reella tal om θ är en varians. Likelihooden beskrivs matematiskt som

P r(X1, ..., Xn|θ) (3.1)

där X1, ..., Xn är data för n individer. Observera att likelihooden inte är en sann täthetsfunktion.

Den andra komponenten, priorfördelningen, är ett antagande om hur parametrarna är fördelade som görs innan data introduceras i modellen (McElreath, 2016). Den beskriver hur troligt analytikern anser det är att parametern antar olika värden och betecknas P r(θ). Priorfördelningen kan tas fram med olika metoder; resultat från tidigare studier, från experter inom området eller utifrån statistikerns egen uppfattning. En

(22)

priorfördelning kan vara icke-informativ, det vill säga inte ha något inflytande på det slutgiltiga resultatet. Den kan också vara starkt eller svagt informativ. En priorfördelning med lite eller ingen information låter likelihooden ha en större roll, medan en mer informativ prior får större inflytande på slutresultatet.

Med dessa två komponenter kan slutligen en posteriorfördelning beräknas. Posteriorfördelningen P (θ|X1, ..., Xn) är en täthetsfördelning för parametrarna givet data. Den tas fram genom att uppdatera antaganden i prior-fördelningen med data (likelihooden) med Bayes sats.

P r(θ|x1, ..., xn) =

P r(x1, ..., xn|θ)P r(θ)

P r(x1, ..., xn) (3.2)

Nämnaren i Bayes sats, P r(x1, ..., xn), är den genomsnittliga likelihooden och används för att posteriorför-delningen ska bli en äkta täthetsfördelning (McElreath, 2016). Posteriorförposteriorför-delningen visar hur troligt det är att parametern antar ett visst värde, givet modellen och data.

3.2

Inferens i Bayesiansk analys

Inom den Bayesianska analysen är posteriorfördelningar centrala för att dra slutsatser om populationen av intresse (McElreath, 2016). Posteriorfördelningar kan beräknas för de flesta mått, exempelvis prediktiv för-delning för en responsvariabel y, för modellparametrar av intresse eller för skillnader mellan parametrar. Visualiseringar är en användbar metod för att skaffa sig en helhetsbild över fördelningen, där det är möjligt. Det finns även sätt att sammanfatta posteriorfördelningen. Två sådana är kredibilitetsintervall och värden maximum a posteori.

Ett kredibilitetsintervall är ett intervall av värden inom vilket en viss mängd av posteriorsannolikheten finns. I den här uppsatsen kommer intervallen dessutom skapas så att lika mycket sannolikhet finns på var sida om intervallet. Exempelvis innebär ett 90 procent kredibilitetsintervall mellan 2 och 7 för en hypotetisk variabel y att sannolikheten är 90 procent att y ligger mellan 2 och 7, med 5 procent sannolikhet att y är mindre än 2 och 5 procent sannolikhet att y är större än 7. Notera att intervallet tolkas direkt utifrån sannolikheten, till skillnad från ett frekventistiskt konfidensintervall.

I regressionssammanhang är det vanligt att beräkna kredibilitetsband. Ett exempelvis 90 procent kredibili-tetsintervall för µi beräknas för varje intressant värde på en förklarande variabel xi (där övriga förklarande variabler hålls konstanta). Om alla sådana intervall plottas bredvid varandra skapas ett band. Ett sådant band visar en region inom vilket de 90 procent mest sannolika regressionslinjerna befinner sig, enligt modellen. Ett annat vanligt mått är typvärdet i en posteriorfördelning. Typvärdet är det värde eller de värden som har högst sannolikhet att inträffa. Om posteriorfördelningen har enbart ett typvärde kan det användas för att sammanfatta fördelningen. Ett sådant värde kallas maximum a posteori (map). När regressionslinjer ska visualiseras används ofta map-skattningar av regressionsparametrarna för att rita en linje.

(23)

3.3

Bayesiansk multilevelmodell

Ett datamaterial kan benämnas som hierarkiskt då dess observationer tillhör ett urval av grupper och analysen gäller både individ- och gruppstrukturen (Goldstein, 1999). Ett vanligt exempel är elever inom skolklasser, där man vill dra slutsatser om både elever och skolklasser generellt. Ofta är vissa förhållanden olika i olika grupper vilket innebär att observationer inom samma grupp är mer lika varandra än observationer från en annan grupp. I en sådan situation är observationerna inte oberoende, vilket är ett antagande i många statistiska modeller. En metod som tar hänsyn till denna gruppstruktur är multilevelmodeller. Ett exempel på hur en Bayesiansk multilevelmodell för en observation i som tillhör grupp j kan ställas upp presenteras i ekvation 3.3 (McElreath, 2016). Här bestäms priorfördelningarna till normala för intercept och halvCauchy för varianser. Detta val förklaras i kapitel 3.4.

yij ∼ N (µj, σy) µj= α + αj α ∼ N (0, 10) αj∼ N (0, σαj) σy ∼HalvCauchy(0, 1) σαj ∼HalvCauchy(0, 1) (3.3)

Värdet på responsvariabeln för en individ i i grupp j är yij och tilldelas här en normalfördelad likelihood med väntevärde µj och standardavvikelse σy. Väntevärdet modelleras i detta fall endast med ett intercept. Interceptet antas variera mellan grupperna och delas därför upp (McElreath, 2016). Den första parametern αrepresenterar det genomsnittliga interceptet för samtliga grupper. Den andra delen, αj, blir en parameter per grupp som beskriver hur en grupp skiljer sig från det genomsnittliga interceptet. De efterföljande raderna är de priorfördelningar som väljs för modellens parametrar. I ekvationen har samtliga αj fått en gemensam priorfördelning med hyperparametern σαj.

Multilevelmodeller har även en egenskap som kallas partiell poolning (McElreath, 2016). Poolning av informa-tion innebär att när modellen skattar värden för en observainforma-tion så används informainforma-tion från övriga observa-tioner för att förbättra skattningarna. I en vanlig regressionsmodell, som ej tar hänsyn till en gruppstruktur, används information från samtliga observationer, vilket kan benämnas som komplett poolning. Motsatsen till den kompletta poolningen är ingen poolning, som innebär att varje grupp j anses oberoende av övriga grup-per. Skattade värden för observationer i en grupp använder då endast information från observationer inom samma grupp. Partiell poolning är en medelväg som tillåter modellen att flexibelt använda information ut-ifrån en grupps behov. De tre olika tillvägagångssätten för poolning av information presenteras i ekvation 3.4.

(24)

Komplett poolning Ingen poolning Partiell poolning yi∼ N (µ, σy) yij∼ N (µj, σy) yij∼ N (µj, σy) µ = α µj= α + αj µj= α + αj α ∼ N (0, 10) α ∼ N (0, 10) α ∼ N (0, 10) σy∼HalvCauchy(0, 1) αj∼ N (0, 10) αj∼ N (0, σαj) σy∼HalvCauchy(0, 1) σy∼HalvCauchy(0, 1) σαj ∼HalvCauchy(0, 1) (3.4)

Modellen till vänster har komplett poolning, vilket erhålls genom att ta bort de gruppspecifika parametrarna αj. Den mittersta modellen har ingen poolning som modelleras genom att vardera αj får en egen priorför-delning. Slutligen är modellen till höger densamma som i ekvation 3.3 och har partiell poolning. Partiell poolning gynnar särskilt grupper med få observationer (McElreath, 2016). Om ingen poolning används kan skattningarna i en sådan grupp blir väldigt osäkra då gruppen inte har så mycket information på egen hand. Den partiella poolningen låter modellen använda extra information från övriga grupper för att minska osä-kerheten.

Multilevelmodeller fungerar som bäst när åtminstone några av grupperna är väldigt lika, alltså nära att ha komplett poolning (Gelman & Hill, 2007). Om alla grupperna skiljer sig mycket åt kommer inte poolningen vara effektiv. Partiell poolning ger fortfarande en bra modell, men kan vara onödigt komplex. I dessa fall kan därför en modell utan poolning troligtvis prestera nästan lika bra.

Modell för longitudinell data

Ett longitudinellt datamaterial består av ett antal individer i = 1, 2, ..., n som har undersökts vid ett antal tidpunkter ti = 1, 2, ..., ki. Notera att olika antal individer kan observeras vid respektive tidpunkt, därmed indexet i på t. Tiden representeras även med en tidsvariabel mtisom representerar en mätning av individ i vid tiden t. Vid varje sådant mättillfälle har ett värde på responsvariabeln ytimätts. Datasetet kan ses som hierarkiskt med tidpunkterna som en första nivå och individerna som en andra nivå. Individerna fungerar då som en hierarkisk gruppering i datamaterialet. Nedan presenteras ett exempel på en modell som beskriver utvecklingen i y över tid för varje individ. En förklaring av vad modellen betyder följer. Observera att likelihood och priorfördelningar endast presenteras här. En diskussion om valen av fördelningar följer i kap 3.4.

(25)

yti∼ N (µti, σy) µti= α + αi+ β1mti α ∼ N (0, 10) β1∼ N (0, 10) αi∼ N (0, σαi) σy ∼HalvCauchy(0, 2) σαi ∼HalvCauchy(0, 2) (3.5)

Modellen liknar den enklare modellen från ekvation 3.3 men väntevärdet beror nu även på tiden, vilket modelleras med β1. I denna modell är tidsutvecklingen densamma för alla individer och parametern får en priorfördelning likt för α. För att modellera en individuell tidsutveckling utvecklas β1 genom att lägga till en variation β1i kring den gemensamma lutningsparametern. Då både interceptet och lutningsparametern varierar på individnivå ges de individuella parametrarna en gemensam, multivariat priorfördelning.

yti∼ N (µti, σy) µti= α + αi+ (β1+ β1i)mti α ∼ N (0, 10) β1∼ N (0, 10) αi β1i ∼ N  0 0 , S  S = σαi 0 0 σβ1i R σαi 0 0 σβ1i σy ∼HalvCauchy(0, 2) σαi ∼HalvCauchy(0, 2) σβ1i ∼HalvCauchy(0, 2) R ∼LKJcorr(2) (3.6)

Den multivariata priorfördelningen får en kovariansmatris S. Denna matris består av standardavvikelser för de individuella parametrarna samt av en korrelationsmatris R, som beskriver det linjära sambandet mellan individers intercept och lutningar.

Ett longitudinellt datamaterial kan även innehålla förklarande variabler. Data ser ut likt tidigare men nu även med p stycken förklarande variabler. Nedan presenteras hur en sådan modell kan se ut om effekterna för samtliga förklarande variabler antas variera på individnivå.

(26)

yti∼ N (µti, σy)

µti= α + αi+ (β1+ β1i)mti+ (β2+ β2i)x1ti+ ... + (βp+1+ βp+1i)xpti

α ∼ N (0, 10) β1∼ N (0, 10) β2∼ N (0, 10) ... βp+1∼ N (0, 10) αi β1i β2i ... βp+1i ∼ N  0 0 0 ... 0 , S  S = σαi 0 0 . . . 0 0 σβ1i 0 . . . 0 0 0 σβ2i . . . 0 ... ... ... ... 0 0 0 0 0 σβp+1i R σαi 0 0 . . . 0 0 σβ1i 0 . . . 0 0 0 σβ2i . . . 0 ... ... ... ... 0 0 0 0 0 σβp+1i σy ∼HalvCauchy(0, 2) σαi ∼HalvCauchy(0, 2) σβ1i ∼HalvCauchy(0, 2) σβ2i ∼HalvCauchy(0, 2) ... σβp+1i∼HalvCauchy(0, 2) R ∼LKJcorr(2) (3.7)

3.4

Val av likelihood och priorfördelning

Val av likelihood

Till samtliga modeller som anpassas i uppsatsen väljs en normalfördelad likelihood. En normalfördelning innehåller endast två parametrar; ett väntevärde och en varians som är symmetrisk, vilket är det mest grund-läggande som kan antas för en fördelning (McElreath, 2016). Med de två parametrarna kan fördelningen se ut på många olika sätt utan att behöva introducera nya antaganden som kräver mer kunskap. Fördelningen är därför ett bra val om förhandsinformation saknas. Det är även en vanligt förekommande fördelning och då ingen annan information har erhållits anses denna fördelning som en bra utgångspunkt.

(27)

Val av priorfördelningar

En icke-informativ priorfördelning är en fördelning som låter likelihooden styra hur posteriorfördelningen ser ut (McElreath, 2016). För intercept och lutningsparametrar väljs normalfördelade priorfördelningar. För att en normalfördelad prior ska bli icke-informativ sätts ett stort värde på variansen medan det förväntade värdet sätts till 0. Detta leder till en stor spridning av både positiva och negativa värden som en parameter kan anta. Motiveringen till valet är i stor utsträckning densamma som för valet av likelihood. Utöver de anledningarna är normalfördelningen även lätt att generalisera till flera dimensioner, vilket är användbart om flera parametrar ges en gemensam, multivariat priorfördelning likt i ekvation 3.7.

I modeller där intercept och lutningsparameter ges en multivariat priorfördelning behövs en priorfördelning för korrelationsmatrisen R. Matrisen får priorfördelningen LKJcorr(η), vilket är en fördelning mellan −1 och 1. Fördelningen beror på η, vilket är en parameter som styr hur snäv fördelningen är kring 0. Om parametern sätts till 1 skulle det innebära en uniform fördelning, medan större värden på η ger en snävare fördelning kring 0 med mindre sannolikhet för starka korrelationer.

För varianser väljs halvCauchy-fördelningar. Denna fördelning har en lägre gräns på 0 och en avtagande sanno-likhet för större värden. Den parameter som styr hur snabbt avtagandet sker betecknas γ och ju mindre denna parameter är desto mindre troligt blir stora värden. HalvCauchy-fördelningen är inte helt icke-informativ utan istället svagt regulariserande (McElreath, 2016). Regulariserande, eller svagt informativa, priorfördelningar låter till stor del data styra hur posteriorfördelningen ser ut, men begränsar hur mycket modellen får lära sig av data för att minska risken för överanpassning. Regulariseringen sker genom att minska priorfördelningens varians, vilket leder till att extrema värden ses som mindre troliga. Om variansen sätts för liten kan det dock leda till underanpassning då legitima värden faller utanför gränserna för vad priorfördelningen anser troligt. Hur informativ en priorfördelning faktiskt är i en given modell utvärderas genom en känslighetsanalys. En känslighetsanalys innebär att en modell anpassas om med olika värden på parametrar och hyperparametrar i priorfördelningen för en viss parameter. Sedan jämförs posteriorfördelningarna från varje anpassning för att se om de skiljer sig mycket åt. På så sätt skapas en bild av hur mycket inflytande priorfördelningen har på posteriorfördelningen för olika värden på priorns parametrar.

3.5

Anpassning av modell - Markov Chain Monte Carlo

En metod för att ta fram posteriorfördelningar är att använda en algoritm som stokastiskt utforskar posteri-orfördelningen för att kartlägga dess form (McElreath, 2016). Det finns flera olika sådana algoritmer och dessa har fått samlingsnamnet Markov Chain Monte Carlo (MCMC). Algoritmerna har olika för- och nackdelar och den algoritm som används i denna uppsats är Hamiltonian Monte Carlo (HMC).

HMC-algoritmen kräver mer datorkraft och är därför mer tidskrävande än många andra algoritmer, som exempelvis Metropolis-algoritmen eller Gibbs sampling. En stor fördel är dock att den mer effektivt utforskar posteriorfördelningar. Det beror på att utforskningen inte är helt slumpmässig utan delvis styrs av regler som effektiviserar processen. Den högre effektiviteten innebär att HMC-algoritmen ger bättre resultat för modeller med många parametrar. Utforskningen sker genom att låta parametervärdena representeras av en partikel som rör sig fram och tillbaka över posteriorfördelningen och under tiden samplar värden. I de områden av

(28)

fördelningen som har större sannolikhet rör sig partikeln långsammare, vilket innebär att den överlag kommer sampla flera värden från områden av fördelningen med hög täthet än från områden med låg täthet (svansarna). Målet med algoritmen är att de samplade värdena, som tillsammans bildar en MCMC-kedja, ska konvergera mot posteriorfördelningen. Att utvärdera om en kedja har konvergerat kan göras både visuellt och med olika utvärderingsmått. För att visuellt bedöma om kedjan ser ut att ha konvergerat plottas de samplade värdena i så kallade trace-plottar. Om ett stabilt sicksack-liknande mönster kring ett värde kan observeras är det ett bra tecken att konvergens har uppnåtts. Sicksack-mönstret visar att algoritmen konstant utforskar hela posteriorfördelningen och om det är stabilt kring ett visst värde är detta värde troligen posteriormedelvärdet. Två vanliga utvärderingsmått är antalet effektiva dragningar (nef f) och Gelman-Rubins konvergensdiagnostik ( ˆR). Antalet effektiva dragningar är en uppskattning av hur många av de samplade värdena som anses vara oberoende (McElreath, 2016). Hur stor nef f som behövs beror på hur välutforskad posteriorfördelningen behöver vara. Om det endast är posteriormedelvärdet som är av intresse behöver inte nef f vara lika stor som om det är intressant att undersöka mindre sannolika områden av fördelningen. ˆRär en kvot mellan den nuvarande skattade variansen och variansen inom kedjan (Gelman & Rubin, 1992). Om denna kvot är 1 eller väldigt nära 1 är det ett tecken på att kedjan kan ha konvergerat.

De olika metoderna för att utvärdera om konvergens har uppnåtts bör alltid kombineras för att ge en så komplett bild som möjligt, då det alltid finns en risk ett enskilt mått visar på konvergens medan övriga mått ej gör det. För att ytterligare försäkra sig om att konvergens har uppnåtts kan algoritmen upprepas för att få flera kedjor som kan utvärderas tillsammans. Om trace-plottarna för de olika kedjorna till stor del överlappar varandra kring samma värde innebär det att de utforskat samma posteriorfördelning, vilket stärker slutsatsen att algoritmen har konvergerat.

Implementation

För att anpassa modeller med HMC i denna uppsats används Stan, vilket är ett C++ program designat för Bayesiansk inferens (Gelman, Lee & Guo, 2015). Stan anpassar modeller med en HMC-algoritm som byggts vidare med en No-U-Turn Sampler (NUTS). Fördelen med NUTS är att den automatiserar många av de inställningar och parametrar som i vanliga fall behöver sättas och optimeras för hand (Hoffman & Gelman, 2014). Detta sparar tid för användaren och resulterar ändå i lika bra eller bättre modeller jämfört med den manuella algoritmen. Stan kan användas via andra programmeringsspråk såsom Python eller R (Gelman, et al., 2015). R är ett open source programmeringsspråk för statistiska beräkningar (R Core Team, 2019). För att koppla ihop R med Stan används paketet RStan (Stan Development Team, 2019). Detta paket kan i sin tur kan användas av andra paket som förenklar kodningen i R, exempelvis paketet Rethinking (McElreath, 2016). Kod för anpassning av modeller bifogas i bilaga B.

(29)

3.6

Modellutvärdering

Prediktionsförmåga

För att jämföra hur bra två eller fler modeller är på att prediktera nya data beräknas deras Akaike-vikter. Dessa vikter baseras på informationskriteriet Widely Applicable Information Criterion (WAIC). WAIC är ett mått på hur bra modellen predikterar nya observationer och har flera fördelar jämfört med andra in-formationskriterium (McElreath, 2016). Exempelvis är en fördel med WAIC är att posteriorfördelningar i modellen inte behöver antas vara normalfördelade, vilket gör det mer användbart för komplexa modeller. WAIC består av två delar: log-pointwise-predictive-density (lppd) och antalet effektiva parametrar (pW AIC). För att ta fram lppd beräknas först P r(yi)som den genomsnittliga likelihooden över posteriorfördelningen för observation i och sedan summeras logaritmen av detta värde för samtliga observationer:

lppd = N X

i=1

logP r(yi) . (3.8)

Den andra delen, pW AIC, tas fram genom att beräkna V (yi)som variansen för en observations log-likelihood över posteriorfördelningen. Sedan summeras denna varians för samtliga observationer:

pW AIC= N X

i=1

V (yi) . (3.9)

Med de två delarna kan modellens WAIC beräknas. Lppd multipliceras med −2 för att bli mer likt en devians och pW AIC multipliceras med 2 för att straffa modeller med fler parametrar. Beräkningen ser då ut likt

WAIC = −2lppd + 2pW AIC= −2(lppd − pW AIC) . (3.10) Med WAIC beräknat för samtliga modeller kan Akaike-vikterna beräknas. Vikten för en modell l av totalt L modeller beräknas likt

wl= exp(−1 2dW AICl) PL j=1exp(− 1 2dW AICj) (3.11) där dW AIC är skillnaden i WAIC för en modell l och den modell med lägst WAIC. Vikterna för modellerna summerar till 1 och kan tolkas som sannolikheten att en modell är den bästa på att prediktera nya data relativt de modeller som jämförs, givet att den data som användes för att anpassa modellen är representativ för populationen (McElreath, 2016). Då WAIC och dW AIC är skattningar finns det även en viss osäkerhet kring dem, vilket kan mätas genom att beräkna ett standardfel. Om standardfelet för dW AIC är större än skattningen är det inte säkert att den modell som fått större vikt faktiskt är bättre på att prediktera nya data (McElreath, 2016).

Inflytesrika observationer

Ett extremvärde brukar definieras som en observation som kraftigt avviker från det mönster som övriga observationer uppvisar (Kutner, Nachtsheim, Neter och Li, 2005). Av intresse är huruvida extremvärdet är inflytelserikt, det vill säga om det avvikande värdet påverkar modellen på ett betydande sätt. Ett sätt att

(30)

avgöra om ett extremvärde är inflytelserikt är att anpassa den aktuella modellen utan extremvärdet och se om modellen förändras. Om modellen blir tillräckligt annorlunda anses extremvärdet vara inflyesrikt. Vad som är “tillräckligt annorlunda” beror på sammanhanget, men en tumregel är huruvida slutsatserna skulle bli annorlunda eller inte. Observera att en inflytelserik observation inte direkt kan exkulderas ur analysen om det inte kan beläggas att avvikelsen beror på någon felaktighet i datamaterialet. Istället bör extremvärdet inkluderas och slutsatserna dras med dess inflytande i åtanke.

(31)

4.

Resultat

Analysen utförs i två delar. Först undersöks hur resthalterna av bekämpningsmedlen skiljer sig åt mellan de tre kostgrupperna. I den här delen tas ingen hänsyn till det specifika matintaget. Syftet är att avgöra om det finns några skillnader mellan grupperna och över tid. I den andra delen analyseras eventuella samband mellan resthalter och matintag.

4.1

Resthalter av fungicider i de tre kostgrupperna

Den här analysen ämnar besvara uppsatsen första frågeställning: om det finns några skillnader i resthalter beroende på vilken kostgrupp en deltagare tillhör. Den modell som anpassas här kan både förklara skillnader mellan grupperna vid studiens början och hur skillnaderna förändras under studiens gång. Kostgrupperna modelleras med indikatorvariablerna Klimat och Eko. Tidsutvecklingen hos individ i modelleras med tidsva-riabeln mtisom representerar tidpunkterna t = 1, 2, 3 som antal veckor efter första mättillfället, mti= 0, 4, 8. Det innebär att mti är 0 vid första mättillfället (baseline), vilket underlättar tolkningen.

yti∼ N (µti, σy)

µti= α + αi+ β1Klimati+ β2Ekoi+ β3mti+ β4mtiKlimati+ β5mtiEkoi

αi∼ N (0, σαi) α ∼ N (0, 10) βk ∼ N (0, 10) σαi ∼HalvCauchy(0, 2) σy∼HalvCauchy(0, 2) . (4.1)

Interceptet α+αimodellerar halterna hos individ i i kontrollgruppen vid första mättillfället. β1och β2 repre-senterar skillnaden i halter hos individer i klimat- respektive ekogruppen jämfört med kontrollgruppen, även här vid första mättillfället. β3 modellerar tidsutvecklingen hos kontrollgruppen, β4 skillnaden i utveckling mellan klimatgruppen och kontrollgruppen och β5 skillnaden i utveckling mellan ekogruppen och kontroll-gruppen. Posteriorfördelningarna för β4och β5kommer att visa om övergången till en klimatvänlig respektive ekologisk kost leder till någon förändring i resthalter av bekämpningsmedel.

Modellen anpassas med HMC-algoritmen implementerad i Stan. Fyra kedjor körs med 15 000 dragningar i varje kedja, varav 7 000 dragningar i uppvärmingsfasen. Jämförelser av kedjorna med trace-plottar visar att de fyra kedjorna konvergerar mot samma posterior och samplar från hela posteriorfördelningen. Antalet effek-tiva dragningar nef f är större än 3 000 för de flesta parametrar. Undantaget är variansen σαi där nef f = 621

och α20 där nef f = 1328. Vidare är ˆR = 1 för samtliga parametrar. Sammantaget bedöms algoritmen ha konvergerat väl.

(32)

Innan vi går vidare med resultaten från modell 4.1 undersöks huruvida priorfördelningen N(0, 10) för in-tercept och lutningsparametrar verkligen är icke-informativ. Modellen anpassas med priorfördelningar med mindre varians; 1 och 0, 1. Sedan jämförs posteriorfördelningen för βki respektive fall. I tabell 4.1 presenteras 90 procent kredibilitetsintervall för lutningsparametrarna då priorfördelningen är N(0, 10), N(0, 1) respektive N (0, 0, 1). Det framgår att intervallen är mycket lika då priorfördelningen är N(0, 10) och N(0, 1). Då varian-sen sätts till 0, 1, en faktor 100 mindre än den valda priorn N(0, 10), blir intervallen betydligt smalare. Inga intervall är dock entydigt positiva eller entydigt negativa, även då variansen i priorfördelningen är mycket li-ten (0, 1). Dessutom kan variansen väljas tio gånger mindre, 1 istället för 10, utan att posteriorfördelningarna påverkas nämnvärt. Därför anses den valda priorfördelningen N(0, 10) faktiskt vara icke-informativ.

Tabell 4.1: 90 procent kredibilitetsintervall för lutningsparametrarna i modell 4.1 då priorfördelningens varians minskas. Priorfördelning Parameter N (0, 10) N (0, 1) N (0, 0, 1) β1 [-0,32; 0,36] [-0,31; 0,35] [-0,12; 0,16] β2 [-0,24; 0,43] [-0,24; 0,40] [-0,10; 0,18] β3 [-0,02; 0,07] [-0,01; 0,07] [ 0,00; 0,06] β4 [-0,08; 0,05] [-0,08; 0,05] [-0,05; 0,04] β5 [-0,11; 0,01] [-0,11; 0,01] [-0,08; 0,01]

Utöver modell 4.1 undersöks även fallet där tidsutvecklingen tillåts variera mellan individer. Medelhalten µti modelleras då som

µti= α + αi+ β1Klimati+ β2Ekoi+ (β3+ β3i)mti+ β4mtiKlimati+ β5mtiEkoi . (4.2)

Detta samband undersöks både med en multivariat priorfördelning för αioch βi enligt ekvation 3.6 och med univariata priorfördelningar. En jämförelse mellan dessa två modeller och 4.1 visar att modell 4.1 har en betydligt bättre prediktiv förmåga, med Akaikevikten 0, 92. Vi går därför vidare med modell 4.1.

Resultatet från modell 4.1 undersöks med visualiseringar i figur 4.1. Den modellerade förändringen av fungi-cidhalter under studiens gång representeras av maximum a posteori-linjen (map-linjen) för respektive grupp. Det grå området är ett 90 procent kredibilitetsband för linjen. I figurerna finns även de faktiska datapunkter-na utritade. Det framgår att alla tre linjer med 90 procent sannolikhet kan ha både en negativ och en positiv lutning. Figurerna visar också att modellen verkar anpassa data bäst i den ekologiska gruppen, till följd av att det finns färre uteliggande värden.

(33)

Modellering av fungicidhalt, kontrollgruppen Mättillfälle 1 2 3 0.0 0.5 1.0 1.5 2.0 2.5 3.0 Fungicidhalt µg/g kreatin

Modellering av fungicidhalt, klimatgruppen

Mättillfälle 1 2 3 0.0 0.5 1.0 1.5 2.0 2.5 3.0 Fungicidhalt µg/g kreatin

Modellering av fungicidhalt, ekologiska gruppen

Mättillfälle 1 2 3 0.0 0.5 1.0 1.5 2.0 2.5 3.0 Fungicidhalt µg/g kreatin

Figur 4.1: Map-skattning av regressionslinje med 90 procent kredibilitetsband och datapunkterna. Kontroll-gruppen överst till vänster, klimatKontroll-gruppen överst till höger och den ekologiska Kontroll-gruppen underst.

Observera också att det finns några observationer som avviker från mönstret och kan betraktas som ex-tremvärden. Särskilt avvikande är fungicidhalten 3, 2 vid tredje mättillfället i kontrollgruppen. Vi undersöker om denna observation är inflytelserik genom att anpassa modell 4.1 då observationen tagits bort. Figur 4.2 visar samma visualisering som figur 4.1 för kontrollgruppen. Den heldragna linjen är map-skattningen då alla observationer inkluderas och det grå området motsvarande 90 procent kredibilitetsband. Den streckade linjen är map-skattningen då extremvärdet har tagits bort. Denna linje hamnar utanför kredibilitetsbandet och har en negativ lutning. Resultatet blir tillräckligt annorlunda då extremvärdet observeras för att det ska anses vara inflytelserikt. Vi har inget belägg för att extremvärdet skulle bero på någon felaktighet i studien, varför det inte kan tas bort. I fortsättningen inkluderas extremvärdet i analysen, med anmärkningen att ob-servationen ökar sannolikheten att lutningen är positiv. Motsvarande analys har utförts med fungicidhalterna som är större än 1 i klimatgruppen samt fungicidhalten 0, 8 i ekogruppen. Analysen visar att samtliga nya map-linjer ligger inom kredibilitetsbanden för map-linjen då all data används. Ingen av dessa observationer anses därför vara inflytelserika.

(34)

Modellering av kontrollgruppen utan extremvärde

Mättillfälle 1 2 3 0.0 0.5 1.0 1.5 2.0 2.5 3.0 Fungicidhalt µg/g kreatin

Figur 4.2: Map-skattning med all data (heldragen linje) och tillhörande 90 procent kredibilitetsband samt map-skattning då extremvärdet i kontrollgruppen exkluderats (streckad linje) och faktiska datapunkter utom extremvärdet.

Figur 4.1 visar att lutningen, det vill säga utvecklingen över tid inom respektive grupp, med 90 procent san-nolikhet kan vara både positiv och negativ. Det finns alltså ingen entydig förändring av fungicidhalter under studiens gång. Detta blir tydligare om vi betraktar 90 procent kredibilitetsintervall för lutningsparametrar (vänstra kolumnen i tabell 4.1). Samtliga intervall täcker noll. Det finns alltså ingen entydig skillnad i halter under studiens gång och inte heller någon entydig skillnad mellan kostgrupperna.

En mer komplett bild av de modellerade skillnaderna mellan grupperna fås genom att betrakta hela poste-riorfördelningarna för β4 respektive β5. Till vänster i figur 4.3 visas effekten på resthalterna av att gå från en konventionell kost till en klimatvänlig kost (β4), där det grå området representerar kredibilitetsinterval-let. Tätheten är relativt jämt delad mellan negativ och positiv effekt. Till höger i figuren visas effekten av att gå från en konventionell kost till en ekologisk (β5). Här framgår att en större massa finns för negativa värden. Kredibilitetsintervallet täcker noll, men en betydligt större del av intervallet finns på den negativa sidan. Posteriorsannolikheten att β5är negativ är 88 procent. Däremot blir posteriorsannolikheten endast 54 procent om extremvärdet i kontrollgruppen exkluderas. Det bör även noteras att osäkerheten är stor i båda fördelningarna.

Sammantaget visar analysen att det inte finns några entydiga skillnader över tid eller mellan kostgrupper. Posteriorfördelningen för β5 indikerar dock att det är troligt att resthalterna minskar vid övergång från en konventionell till en mer ekologisk kost.

(35)

−0.15 −0.10 −0.05 0.00 0.05 0.10 0.15 0 2 4 6 8 10

Posteriorfördelning effekt hos klimatgruppen

Effekt klimatgruppen T äthet −0.20 −0.15 −0.10 −0.05 0.00 0.05 0.10 0 2 4 6 8 10

Posteriorfördelning effekt hos ekogruppen

Effekt Ekogruppen

T

äthet

Figur 4.3: Posteriorfördelningar för β4och β5från modell 4.1. Skuggningen visar 90 procent kredibilitetsin-tervall. Till vänster: β4, skillnad i utveckling hos klimatgruppen jämfört med kontrollgruppen. Till höger: β5, skillnad i utveckling hos ekogruppen jämfört med kontrollgruppen.

4.2

Samband mellan resthalter av fungicider och matintag

Detta avsnitt ämnar besvara uppsatsens andra frågeställning: hur sambandet ser ut mellan resthalter och matintag. Modeller anpassas med de matgrupper som skapades i avsnitt 2.2 som förklarande variabler. Re-sultatet i avsnitt 4.1 visade att det inte finns några entydiga skillnader över tid, mellan individer eller mellan kostgrupper. Utvecklingen behövde inte heller modelleras unikt för varje individ. Dessa aspekter tas därför inte med i kommande modeller. Modellerna anpassas därför utan någon andra nivå, vilket blir detsamma som enkla och multipla Bayesianska regressionsmodeller. Analysen görs för en matgrupp åt gången. I ett första steg anpassas en enkel modell för att undersöka hur matgruppen x ensamt påverkar resthalten av fungicider y enligt yi ∼ N (µi, σy) µi= α + β1xi α ∼ N (0, 10) β ∼ N (0, 10) σy∼HalvCauchy(0, 2) . (4.3)

Modellerna jämförs sedan med en multipel modell som innehåller samtliga matgrupper för att se om det kan finnas några confounding-effekter mellan matgrupperna. För samtliga matgrupper presterade de enkla modellerna bättre än den multipla då de jämfördes med Akaike-vikter. Parameterskattningarna ändrades inte heller mellan de enkla och den multipla modellen, vilket innebär att det inte finns några confounding-effekter mellan konsumtionen av olika matgrupper. Utifrån detta går vi för varje matgrupp vidare med de enkla modellerna. Till sist utvecklas även några av de enkla modellerna genom att inkludera de ekologiska variabler som skapades i avsnitt 2.3 och interaktioner mellan de ekologiska variablerna och deras motsvarande matgrupp likt

References

Related documents

De som flytter fra utviklings- land til Vesten bryter ikke kontak- ten med hjemlandet, snarere tvert i mot, og mange har flere og andre muligheter til å bidra til utviklingen

(2012) framhöll att högre utbildning hade positiv inverkan på attityder gentemot hiv-positiva patienter och kunde då vara en viktig faktor för att minska stigmatisering

Gruppen där psykiska besvär låg bakom sjukskrivningen skiljde sig klart från dem med andra diagnoser genom att andelen individer som angav positiv eller negativ påverkan

ligaste gränstrakterna. Kanada! Majoren kunde inte säga det ordet förrän han också nämnde Robert W. Services alla dikter och ballader utantill. Ju längre kvällen led och ju mera

Det skulle vara intressant att i framtiden forma en studie som försöker besvara hur aktiemarknaden reagerar eller påverkas vid negativ reporänta för att försöka

Positiv pedagogik rymmer alla de fem perspektiv som Pratt definierat. Möjligen är det en styrka hos undervisningsformen att den spänner över så många perspektiv, möjligen är det

I resultaten kring delaktighet i särskolan upplevde eleverna att deras särskoleplacering inverkade på relationer med andra elever utanför särskolan och möjligheterna att

Om man använder sig av Deegan och Gordons (1996) kriterier för vad som är positiv respektive negativ information och applicerar det på de undersökta företagen visar