• No results found

Analys av hur olika bakgrundsfaktorer påverkar sannolikheten att smittas vid utlandsresor : en studie av fyra vanliga utlansdssmittor

N/A
N/A
Protected

Academic year: 2021

Share "Analys av hur olika bakgrundsfaktorer påverkar sannolikheten att smittas vid utlandsresor : en studie av fyra vanliga utlansdssmittor"

Copied!
96
0
0

Loading.... (view fulltext now)

Full text

(1)

Kandidatuppsats i Statistik

Analys av hur olika bakgrundsfaktorer

påverkar sannolikheten att smittas vid

utlandsresor

– en studie av fyra vanliga utlandssmittor

(2)
(3)

Abstract  

The objective with this Bachelor thesis is to analyze the risk of getting infected per travel night by the diseases Campylobacteriosis, Giardiaiosis, Salmonellosis and Shigellosis when traveling abroad. The main aim is to examine how the risk differs between different destinations. Another aim is to examine how the risk changes over time, by season and also how the risk differs depending on the traveler's sex and age. To be able to implement this, two databases are used. Information on the travel patterns of the Swedes’ between 1997 and 2009 is provided in the sample-based database TDB (Swedish travel and tourism database). Information on cases of disease with Campylobacter, Giardia, Salmonella and Shigella for the same period is available in the Swedish Institute for Infectious Disease Control’s (SMI) monitoring system called SmiNet.

To determine how the explanatory variables affect the probability of infection a generalized linear model is used. Two different analyses are carried out. Analysis A examines how the probability of infection differs between men and women and also how the probability differs between different country groups in comparison with the Nordic countries except Sweden. Analysis B examines how the probability differs between age groups, between seasons and how the probability has changed over time within the country groups.

The results show that the risk of infection per night for all the four diseases is highest in the country group India and neighboring countries. The risk of getting infected per night by Campylobacter and Salmonella is lowest in North America. The risk of getting infected per night by Campylobacter, Salmonella and Shigella are significantly higher for women. The age group at highest risk of infection per night by Giardia, Salmonella and Shigella is persons aged 0-14 years. The seasonal pattern differs both between the diseases and between the country groups.

(4)

 

 

(5)

Sammanfattning  

Syftet med denna kandidatuppsats är att analysera risken att smittas per resnatt av sjukdomarna campylobacter-, giardia-, salmonella- och shigellainfektion vid utlandsresor. Det huvudsakliga målet är att undersöka hur risken skiljer sig mellan olika resmål. Ett annat mål är att undersöka hur risken förändras över tid, över årstid och hur risken skiljer sig beroende på resenärens kön och ålder.

För att kunna genomföra detta används två databaser. Information om svenskars resvanor för åren 1997 till 2009 finns i den urvalsbaserade databasen TDB (svenska rese- och turistdatabasen). Information om sjukdomsfall med Campylobacter, Giardia, Salmonella och Shigella för samma tidsperiod finns i Smittskyddsinstitutets övervakningssystem SmiNet.

För att kunna avgöra hur förklaringsvariablerna påverkar sannolikheten att smittas används en generaliserad linjär modell. Två olika analyser genomförs. Analys A undersöker hur sannolikheten att smittas skiljer sig mellan män och kvinnor och även hur sannolikheten skiljer sig mellan olika landgrupper i jämförelse med Nordiska länder utom Sverige. Analys B undersöker hur sannolikheten skiljer sig mellan åldersgrupper, mellan årstider samt hur sannolikheten har förändrats över tid inom de olika landgrupperna.

Resultatet visar att risken att smittas per natt av alla de fyra sjukdomarna är störst i landgruppen Indien och grannländer. Risken att smittas per natt med Campylobacter och Salmonella är minst i Nordamerika. Risken att smittas per natt av Campylobacter, Salmonella och Shigella är signifikant större för kvinnor. Den åldersgrupp som löper störst risk att smittas per natt med Giardia, Salmonella och Shigella är personer i åldern 0-14 år. Säsongsmönstret skiljer sig åt både mellan sjukdomarna och mellan landgrupperna.

(6)

 

 

(7)

Förord  

Vi vill tacka vår handledare vid Linköpings Universitet, Olle Eriksson, för all vägledning och allt engagemang i arbetet. Olle har varit en stor kunskapskälla och har även varit till stor hjälp genom stöd och rådgivning. Handledningen som vi har fått har varit mycket uppskattad.

Uppsatsen är genomförd på uppdrag av avdelningen för epidemiologi på Smittskyddsinstitutet. Vi vill rikta ett stort tack till våra handledare Sofie Ivarsson och Margareta Löfdahl för visat engagemang och entusiasm. Sofie och Margareta har under uppsatsens gång varit positiva och öppna för förslag och diskussioner.

Till sist vill vi även tacka våra opponenter Christian Bobeck och Maja Osterman för intressanta synpunkter och förbättringsförslag.

Josefine Johansson Sofia Papanikolaou

(8)
(9)

Innehållsförteckning

  1   Inledning... 1   1.1   Bakgrund ... 1   1.2   Uppdragsgivaren ... 1   1.3   Syfte ... 2   1.4   Problemformulering ... 2   1.5   Om sjukdomarna ... 2   1.6   Databaserna ... 4   1.6.1   Resedatabasen ... 4   1.6.2   SmiNet... 6   2   Metod ... 7   2.1   Målpopulation ... 7  

2.2   Generaliserad linjär modell ... 7  

2.2.1   Generaliserad linjär modell teori... 7  

2.2.2   Odds och oddskvot ... 9  

2.2.3   Maximum likelihood-skattning ... 10  

2.2.4   Interaktionstermer ... 10  

2.2.5   Två regressionsmodeller... 11  

2.2.6   Överspridning... 12  

2.2.7   Referens- och effektkodning ... 14  

2.3   Databearbetning ... 15  

2.3.1   Gallring och gruppering ... 15  

2.3.2   Sammanfogning av databaserna... 17  

2.3.3   Avrundning av antal resnätter ... 18  

2.3.4   Avsaknad av vissa kombinationer i resedatabasen... 18  

2.3.5   Utjämning av antal resnätter... 19  

2.3.6   Osäkerhet i antal resnätter ... 20  

3   Beskrivande statistik ... 23  

3.1   Resedatabasen ... 23  

3.2   SmiNet ... 24  

(10)

4   Resultat ... 31   4.1   Analys A ... 32   4.1.1   Campylobacter... 32   4.1.2   Giardia ... 33   4.1.3   Salmonella ... 34   4.1.4   Shigella... 35   4.2   Analys B... 35   4.2.1   Campylobacter... 36   4.2.2   Giardia ... 37   4.2.3   Salmonella ... 38   4.2.4   Shigella... 39  

4.2.5   Fördjupad analys av utvecklingen i Norra Afrika och Östasien ... 40  

5   Diskussion... 43  

5.1   Täckningsfel... 43  

5.2   Tillförlitlighet av data i resedatabasen ... 43  

5.3   Tillförlitlighet av data i SmiNet ... 44  

5.4   Avgränsningar ... 45  

5.5   Antaganden ... 46  

5.6   Interaktionstermer ... 46  

6   Slutsats... 49  

(11)

Diagram-­  och  tabellförteckning    

Diagram 3.2.1 Uppgift om sannolikt smittland för campylobacterinfektion ... 24  

Diagram 3.2.2 Uppgift om sannolikt smittland för giardiainfektion ... 25  

Diagram 3.2.3 Uppgift om sannolikt smittland för salmonellainfektion... 26  

Diagram 3.2.4 Uppgift om sannolikt smittland för shigellainfektion... 26  

Diagram 4.2.1 Förändring av smittorisken i Norra Afrika ... 40  

Diagram 4.2.2 Förändring av smittorisken i Östasien ... 41  

Tabell 3.2.1 Antal utlandssmittade fall med Campylobacter, Giardia, Salmonella och Shigella ... 27  

Tabell 4.1.1 Analys A för campylobacterinfektion. ... 32  

Tabell 4.1.2 Analys A för giardiainfektion... 33  

Tabell 4.1.3 Analys A för salmonellainfektion. ... 34  

Tabell 4.1.4 Analys A för shigellainfektion. ... 35  

Tabell 4.2.1 Analys B för campylobacterinfektion. ... 36  

Tabell 4.2.2 Analys B för giardiainfektion... 37  

Tabell 4.2.3 Analys B för salmonellainfektion... 38  

Tabell 4.2.4 Analys B för shigellainfektion. ... 39  

Bilageförteckning  

Bilaga I Landgrupper

Bilaga II Beskrivande statistik Bilaga III Analys A och B

(12)
(13)

1

1 Inledning  

I detta kapitel beskrivs bakgrunden till och syftet med rapporten.

1.1 Bakgrund  

Smittskyddsinstitutet har i ett projekt under år 2009 jämfört data över sjukdomsfall med data över resvanor i syfte att analysera trender i sjukdomsfall utomlands samt att beräkna sannolikheten att smittas av olika sjukdomar på olika destinationer. Detta arbete pekade på intressanta mönster som till exempel förändringar över tiden.

Denna rapport undersöker risken att smittas per natt med Campylobacter, Giardia, Salmonella och Shigella vid utlandsresor. Faktorer som kan påverka smittorisken såsom resmål, säsong och resenärens kön och ålder analyseras. Mönstret för dessa sjukdomar har även tidigare undersökts, men aldrig i kombination med resvanor i form av antal resnätter.

1.2 Uppdragsgivaren  

Uppdragsgivaren för rapporten är avdelningen för epidemiologi på Smittskyddsinstitutet (SMI). SMI är en myndighet som bevakar det epidemiologiska läget beträffande smittsamma sjukdomar. Myndigheten arbetar med många olika områden såsom forskning och metodutveckling, experimentell biomedicin, mikrobiologisk diagnostik samt epidemiologisk övervakning, analys och utvärdering. Inom området epidemiologisk övervakning, analys och utvärdering finns en av SMI:s huvuduppgifter nämligen övervakning av smittsamma infektionssjukdomar. Avdelningen för epidemiologi ansvarar för övervakningen av sjukdomsläget.

När verksamheten startade år 1909, var det under namnet Statsmedicinska Anstalten. Diagnostiska undersökningar, som utgjorde en viktig del av verksamheten, gjordes för att upptäcka smittsamma sjukdomar hos människor och djur. En annan viktig del i verksamheten var framställning av bakteriologiska preparat. År 1918 fick Statsmedicinska Anstalten namnet Statens Bakteriologiska Laboratorium (SBL). SBL

(14)

2

delades år 1992 upp i ett privat bolag, SBL Vaccin AB och en statlig myndighet, Smittskyddsinstitutet.

1.3 Syfte  

Syftet med rapporten är att hitta och statistiskt säkra förekommande trender för risken att smittas med Campylobacter, Giardia, Salmonella och Shigella genom att studera sjukdomsdata och resedata för åren 1997 till 2009. En annan del av syftet är att ta reda på hur sannolikheten att smittas skiljer sig mellan olika destinationer, hur denna sannolikhet påverkas av säsong och resans längd samt av resenärens kön och ålder. För att ta hänsyn till duration (antal resnätter) analyseras sannolikheten att smittas per resnatt.

1.4 Problemformulering  

• Hur stor är sannolikheten att smittas för olika resmål jämfört med referensländerna Norge, Danmark, Finland och Island?

• Hur förändras denna sannolikhet över tid? • Hur ser säsongsmönstret ut?

• Hur påverkas smittorisken av resenärens kön och ålder?

1.5 Om  sjukdomarna  

De sjukdomar som analyseras i rapporten är campylobacter-, giardia-, salmonella- och shigellainfektion. Anledningen till att just dessa sjukdomar har valts är att de är vanliga utlandssmittor. Sjukdomarna är alla vatten- och livsmedelsburna sjukdomar. Gemensamt är också att de är mag- och tarmsjukdomar och vanliga symptom är feber, diarré och magsmärtor.

Infektion med Campylobacter, Giardia, Salmonella och Shigella är alla anmälningspliktiga sjukdomar enligt Smittskyddslagen. De anmälningspliktiga sjukdomarna delas in i olika grupper. Samtliga fyra sjukdomar som finns med i denna rapport ingår i gruppen allmänfarliga sjukdomar. En allmänfarlig sjukdom är enligt Smittskyddsinstitutet en ”smittsam sjukdom som kan vara livshotande, innebära

(15)

3

långvarig sjukdom eller svårt lidande eller medföra andra allvarliga konsekvenser och där det finns möjlighet att förebygga smittspridning”1.

Campylobacterinfektion  

Campylobacterinfektion är en zoonotisk sjukdom vilket innebär att sjukdomen kan överföras mellan djur och människa. Campylobacter är en vanlig bakterie över hela världen. I Sverige inrapporteras runt 7 000 fall per år och cirka 60 procent av dessa är utlandssmittade.

Det finns olika typer av campylobacter. Några av dessa orsakar mag- och tarmsymptom hos människa. Bakterien förekommer även hos olika djur såsom nötkreatur, gris, fåglar och får. Sjukdomen sprids oftast via livsmedel och bakterien utsöndras med avföringen hos både djur och människor. Infektionsdosen är låg vilket betyder att antalet bakterier som behövs för att smittas är lågt.2

Giardiainfektion  

Giardiainfektion är en zoonotisk sjukdom som finns över hela världen. Sjukdomen orsakas av en parasit som kan förekomma hos de flesta däggdjur, till exempel hund, katt, nötboskap och får. I Sverige rapporteras ungefär 1 300 fall in per år och cirka 80 procent av dessa fall har smittats utomlands. I de fall där personen har smittats i Sverige är det vanligast att smittan har kommit från familj eller förskola.

Giardia ger en tarminfektion som orsakas av ett encelligt urdjur som heter Giardia lamblia. Smittan sprids via avföringen och sprids oftast via avloppsvatten, till exempel då grönsaker sköljs med avloppspåverkat vatten. Giardiainfektionen är även en sexuellt överförbar sjukdom. Man kan bära på giardiainfektionen utan att få några symptom.3

1 Smittskyddsinstitutet, Anmälningspliktiga sjukdomar, 26 april 2010,

<

http://www.smittskyddsinstitutet.se/sjukdomar/overvakning-av-smittsamma-sjukdomar/anmalningspliktiga-sjukdomar/>

2 Smittskyddsinstitutet, Sjukdomsinformation om campylobacterinfektion, 28 januari 2010,

http://smi.se/sjukdomar/campylobacterinfektion/

3 Smittskyddsinstitutet, Sjukdomsinformation om giardiainfektion, 28 januari 2010,

(16)

4

Salmonellainfektion  

I Sverige inrapporteras runt 4 000 fall av salmonellainfektion per år. Av dessa är cirka 80 procent utlandssmittade. Infektion med salmonellabakterier är en zoonotisk sjukdom som är vanlig över hela världen. Det finns över 2000 olika typer av salmonella och endast ett 20-tal av dessa är förhållandevis vanliga i Sverige.

Salmonellabakterier kan överföras mellan djur och människor genom kontaminerade livsmedel. Bakterierna förekommer hos olika djurslag såsom nötkreatur, gris, fjäderfän och olika sällskapsdjur som reptiler och ödlor. Infektionsdosen är hög och de som är mest mottagliga för bakterierna är små barn, äldre och immunsvaga.4

Shigellainfektion  

I Sverige inrapporteras omkring 500 fall av shigellainfektion varje år. Av dessa är cirka 80 procent smittade utomlands. Sjukdomen är allvarlig i utvecklingsländer och orsakar där många dödsfall.

Infektionen orsakas av shigellabakterier. Bakterierna finns i avföringen hos smittade personer och sprids oftast genom smittad mat, till exempel grönsaker som sköljts med avloppspåverkat vatten. Sjukdomen kan även smitta direkt från person till person vid dåliga hygieniska förhållanden. Detta inträffar även i Sverige. Infektionsdosen är låg.5

1.6 Databaserna  

Detta kapitel innehåller bakgrundsinformation om databaserna resedatabasen och SmiNet. I kapitlet beskrivs också innehållet och variablerna i de båda databaserna.

1.6.1 Resedatabasen  

Svenska rese- och turistdatabasen (TDB) är en databas som ägs av företaget Resurs AB. Företaget genomför varje månad 2 000 telefonintervjuer som handlar om resor och resvanor. Vem som rings upp bestäms genom ett slumpmässigt urval av fasta

4 Smittskyddsinstitutet, Sjukdomsinformation om salmonellainfektion, 28 januari 2010,

<http://smi.se/sjukdomar/salmonellainfektion/>

5 Smittskyddsinstitutet, Sjukdomsinformation om shigellainfektion, 28 januari 2010,

(17)

5

telefonabonnemang i Sverige. Databasen har resedata från 1989. Databasen köps in till Smittskyddsinstitutet och uppdateras årligen.

Vid intervjun frågas först om kön och ålder på samtliga hushållsmedlemmar. En av dessa personer väljs därefter slumpmässigt ut och intervjuas om sina resvanor. Respondenten frågas då om han eller hon har avslutat en resa föregående månad. Varje rad i resedatabasen motsvarar en persons resa. Respondenten kan exempelvis uppge att han eller hon har gjort två resor den senaste månaden och då hamnar dessa två resor på olika rader. Om respondenten har gjort fler än två resor är det ändå bara två resor som följs upp. Det finns i resedatabasen information om ifall resan var en affärs- eller fritidsresa, övernattnings- eller dagsresa. Det finns även information om färdsätt, boendeform, syfte med resan, spenderade pengar under resan, bokningssätt, resmål med mera. I rapporten används dock inte alla variabler utan de som ansågs mest relevanta för frågeställningarna valdes ut för att analyseras.

Resedatabasen innehåller ursprungligen både resor inom Sverige och utlandsresor. Smittskyddsinstitutet köper bara in information om utlandsresor och därför är det endast dessa resor som analyseras.

Använda  variabler  i  resedatabasen  

• Kön

• Åldersgrupp (15-årsintervall) • Resår

-­‐ Under vilket år resan avslutades • Resmånad

-­‐ Under vilken månad resan avslutades • Huvudsakligt resmål (land)

• Huvudsakligt resmål (stad)

• Antal nätter i huvudsakligt besökt land

• Totalt antal övernattningar i samband med resan • Resvikt

(18)

6

Resvikt är en viktvariabel som används för att resedata ska representera Sveriges befolkning på bästa sätt. Vikten är baserad på antal intervjuer, antal resor som inte följts upp i intervjun och på Statistiska centralbyråns statistik över Sveriges befolknings länstillhörighet, kön och ålder.

1.6.2 SmiNet  

Smittskyddsinstitutet tar emot inrapporteringar av anmälningspliktiga sjukdomar och dessa registreras i övervakningssystemet SmiNet. För varje fall skickas två typer av anmälningar till SmiNet: en klinisk anmälan från behandlande läkare samt en laboratorieanmälan från analyserande laboratorium. Både den kliniska anmälan och laboratorieanmälan skall göras senast 24 timmar från diagnosen.

Använda  variabler  i  SmiNet  

• Kön

• Åldersgrupp (15-årsintervall) • Statistikdatum

-­‐ Anger det datum då den första anmälan inkommit till SmiNet. • Sannolikt smittland

-­‐ Anger det land som patienten troligtvis smittats i. Patienten tillfrågas om sannolikt smittland av den behandlande läkaren och i den kliniska anmälan rapporteras svaret. Denna uppgift är ej obligatorisk.

• Smittort

-­‐ Anger den ort som patienten troligtvis smittats i. Denna uppgift är ej obligatorisk.

• Misstänkt anmälningspliktig sjukdom

(19)

7

2 Metod  

I detta kapitel beskrivs målpopulationen, den valda metoden och databearbetningen.

2.1 Målpopulation  

Målpopulationen för rapporten är alla personer i Sverige som rest och övernattat utomlands.

Rampopulationen är alla personer i Sverige som är yngre än 75 år som har rest utomlands och stannat minst en natt. För att ingå i rampopulationen krävs att ett fast telefonabonnemang finns i hushållet och att personen är svensktalande.

Ramen består av resedata som innehåller information om genomförda resor. Resedata är baserad på en resvaneundersökning som genomförs månatligen. Urvalsramen för resvaneundersökningen är personer i Sverige som har ett fast telefonabonnemang i hushållet. Då resvaneundersökningen startade år 1997 hade majoriteten av Sveriges befolkning fast telefonabonnemang. I dagsläget är denna andel mindre då fler och fler väljer att inte ha fast abonnemang. Endast personer som pratar svenska undersöks i telefonintervjuerna som resedatabasen baseras på. Personerna måste även vara yngre än 75 år, då detta är den övre åldersgräns som resedatabasen använder. Personer som inte har fast telefonabonnemang, inte pratar svenska eller är 75 år eller äldre räknas därför som undertäckning. Undertäckning uppstår då rampopulationen inte omfattar hela målpopulationen.

2.2 Generaliserad  linjär  modell  

I detta kapitel beskrivs den generaliserade linjära modellen och varför denna modell valts.

2.2.1 Generaliserad  linjär  modell  teori  

Binomialfördelning

Binomialfördelningen är den sannolikhetsfördelning som används när man utgår från oberoende identiska försök och räknar hur många gånger en viss händelse inträffar. Y

(20)

8

är antalet gånger händelsen inträffar, n är antalet försök och π är sannolikheten att händelsen inträffar i ett enskilt försök. Sannolikheten att Y antar värdet y är:

För datamaterialet som behandlas i rapporten är Y antalet sjukdomsfall, n det totala antalet resnätter och π sannolikheten att smittas per resnatt. Om sannolikheten skulle skattas enligt denna modell inkluderas inga förklaringsvariabler. Det finns dock faktorer som troligen påverkar sannolikheten att smittas. Av denna anledning behöver en mer komplex modell som tar hänsyn till dessa faktorer användas. 6

Förklaringsvariabler

De förklaringsvariabler som antas påverka sannolikheten att smittas är kön, åldersgrupp, landgrupp, år och årstid. Dessa kallas i fortsättningen generellt för X1, X2,

..., XI där I är antalet förklaringsvariabler. En viss kombination av dessa

förklaringsvariabler kallas för j och det totala antalet kombinationer kallas för J. Antalet smittade inom en kombination kallas för Yj. Denna variabel antas vara

binomialfördelad där nj är antalet resnätter och πj är sannolikheten per resnatt inom

kombinationen. Sannolikheten πj är en funktion av förklaringsvariablerna X1j, X2j, ...,

XIj och parametrarna β0,β1, ..., βI. Modell

För att sannolikheten πj ska anta ett värde mellan 0 och 1 används följande funktion för

att beräkna sannolikheten att smittas per resnatt:

6 Nationalencyklopedin, Binomialfördelning, 16 mars 2010,

(21)

9 Modellen för antalet smittade är:

Generaliserad linjär modell med logitlänk används för att skatta parametrarna. Logitlänk används för att skapa en linjär modell med koefficienterna β0, β1,..., βI.

Logitfunktionen av sannolikheten att smittas per resnatt blir en linjär regressionsekvation som ser ut på följande sätt:

Logit(πj) = = β0 + β1X1j + ... + βIXIj

Metoden ger en uppfattning om hur olika förklaringsvariabler påverkar sannolikheten att smittas per resnatt.

Antal sjukdomsfall, Y, är observerade. Antal resnätter, n, och förklaringsvariablerna Xi

betraktas som givna. Parametrarna, βi, skattas med hjälp av datamaterialet och dessa

används för att bedöma hur sannolikheten att smittas påverkas av nivåerna på förklaringsvariablerna. 7

2.2.2 Odds  och  oddskvot  

För att avgöra vilka nivåer av förklaringsvariablerna, exempelvis vilka år, som medför en hög sannolikhet att smittas jämförs sannolikheten att smittas per resnatt för olika nivåer i form av oddskvoter. Odds och oddskvot räknas ut enligt följande:

Odds = Oddskvot =

där nivå A är den nivå som undersöks och nivå B är den nivå som jämförs med. Då modellen har anpassats får man ut oddskvoterna genom följande samband: Skattad oddskvoti = där bi är de skattade parametrarna.

(22)

10

Ett 95-procentigt konfidensintervall för oddskvoten räknas ut enligt följande:

Resultatet presenteras i form av oddskvoter, där en nivås odds jämförs med en referensgrupps odds alternativt med oddset för genomsnittet av alla nivåer.

2.2.3 Maximum  likelihood-­skattning  

I den generaliserade linjära modellen används Maximum likelihood-skattning (ML-skattning) för att hitta och fastställa skattningarna för de olika parametrarna β0,β1, ...,

βI och parametrarnas standardfel.

ML-skattning avser att maximera sannolikheten att få den datamängd som har observerats genom att välja parameterskattningarna så att likelihoodfunktionen, L, maximeras.

På detta sätt skattas parametrarna β0, β1, ..., βI och dessa parameterskattningar

betecknas b0, b1, ..., bI. Metoden för att skatta standardfelen som betecknas se(b0),

se(b1), ..., se(bI) beskrivs ej här. För beskrivning av denna metod, se Tamhane, Dunlop

(2000).8

Modellerna anpassas i SAS genom proc logistic. Teoretiskt sätt är generaliserad linjär modell med logitlänk detsamma som logistisk regression. Av formuleringsmässiga skäl kommer därför den generaliserade linjära modellen i fortsättningen att kallas för logistisk regression.

2.2.4 Interaktionstermer  

En interaktionsterm är en variabel i en regressionsmodell som består av en produkt av två olika variabler, X1*X2. Anledningen till att en interaktionsterm ska inkluderas är

att det antas att storleken på effekten av X1 beror på värdet på X2 och tvärtom. Det är

8 A. C. Tamhane & D. D. Dunlop, Statistics and data analysis: from elementary to intermediate, Prentice

(23)

11

även möjligt att skapa interaktionstermer med fler än två variabler men detta kommer inte att behandlas här.

Av de fem ursprungliga förklaringsvariablerna kön, landgrupp, åldersgrupp, årstid och år, kan tio interaktionstermer med två variabler skapas. Av dessa tio har tre interaktionstermer inkluderats i modellen och dessa är landgrupp*år, landgrupp*årstid och landgrupp*åldersgrupp. Dessa tre termer är intressanta att inkludera för att kunna se hur sannolikheten att smittas i en viss landgrupp förändras över tid, över årstid och beroende på resenärens ålder.

2.2.5 Två  regressionsmodeller  

Två olika logistiska regressionsanalyser genomförs. Anledningen till detta är att års-, årstids- och åldersmönstren inom de olika landgrupperna antas skilja sig åt. Könseffekten antas däremot inte skilja sig mellan de olika landgrupperna. Detta gör att två olika modeller behöver anpassas och därför genomförs två analyser.

Syftet med regressionsanalysen är dels att undersöka hur sannolikheten att smittas skiljer sig mellan olika landgrupper i jämförelse med Nordiska länder utom Sverige och att ta reda på hur sannolikheten skiljer sig mellan män och kvinnor. Analysen som undersöker dessa sannolikheter kallas hädanefter för Analys A.

Syftet är även att ta reda på hur sannolikheten skiljer sig mellan olika åldersgrupper, mellan olika årstider samt hur sannolikheten har förändrats över tid inom varje landgrupp. På grund av att datamaterialet är otillräckligt för många av landgrupperna väljs dock endast de fyra landgrupper ut som har flest antal smittade för vidare analys. Denna analys, som alltså endast omfattar de fyra landgrupperna, kommer hädanefter att refereras till som Analys B.

Analys  A  

I Analys A undersöks hur sannolikheten att smittas skiljer sig mellan olika landgrupper i jämförelse med Nordiska länder utom Sverige och även hur sannolikheten skiljer sig mellan män och kvinnor. För Campylobacter och Salmonella finns ett stort antal smittade som är fördelade på ett sådant sätt att det är möjligt att skatta de tre

(24)

12

interaktionstermerna och därmed tillåta års-, årstids- och åldersmönstren inom de olika landgrupperna att skilja sig åt. Funktionen som skattar sannolikheten att smittas per vistelsenatt ser för Campylobacter och Salmonella ut på detta sätt:

π =

För Shigella och Giardia finns dock för litet antal smittade för att kunna skatta interaktionstermerna. Därför har alla interaktionstermer uteslutits ur modellen för dessa två sjukdomar. Det innebär att ett antagande görs om att mönstren är desamma inom de olika landgrupperna. Funktionen ser istället ut som följer:

π =

Analys  B  

I Analys B analyseras förändringen över tid, över årstid och beroende på resenärens ålder. Detta görs endast för de fyra landgrupperna med flest antal smittade per sjukdom. En ny regressionsmodell anpassas alltså för varje av dessa fyra landgrupper. Funktionen som skattar sannolikheten att smittas per vistelsenatt i Analys B är följande:

π =

2.2.6 Överspridning  

I en modell med ett antal förklaringsvariabler, X, och ett antal försök, n, kan variabeln antalet lyckade försök, Y, se ut att vara binomialfördelad men med större spridning än en exakt binomialfördelning. Anledningen till att fördelningen är mer utspridd kan vara att det finns fler underliggande förklaringsvariabler, interaktion mellan några av förklaringsvariablerna eller beroenden som inte tagits hänsyn till. I dessa fall blir flera binomialfördelningar överlappade och det resulterar i större spridning. Detta kallas för att data uppvisar överspridning.

(25)

13

Det finns statistiska metoder för att testa om data är överspridda. För en korrekt specificerad modell ska ”Pearson chi-square”-statistikan dividerat med antalet frihetsgrader vara ungefär lika med ett. När detta värde är signifikant större än ett finns det en risk att antagandet om normalfallet av binomial variation inte stämmer.

”Pearson chi-square”-statistikan beräknas på följande sätt:

Då regressionsmodellerna anpassades till datamaterialet som analyseras i rapporten blev ”Pearson chi-square”-statistikan dividerat genom antalet frihetsgrader signifikant större än ett för samtliga modeller. Datamaterialet verkar alltså ha större spridning än vad som förväntas vid en exakt binomialfördelning, vilket innebär att det uppvisar överspridning. Detta korrigeras för genom att använda överspridningskorrigering med Williams metod.

Williams metod för att korrigera för överspridning genomförs genom att skatta väntevärdet och variansen för antalet lyckade försök för en viss kombination, j, med följande metod:

E(Yj) = njπj

Var(Yj) = φ njπj (1 – πj)

där φ är en positiv skalningsparameter som skattas i proceduren proc logistic i SAS.  9

 

Korrigeringen för överspridning påverkar inte väntevärdet och därmed inte parameterskattningarna bi. Metoden påverkar endast variansen och därmed

standardfelen se(bi). Standardfelen blir något större och hur mycket större beror på hur

stor överspridning datamaterialet uppvisar. Resultatet blir något bredare kondfidensintervall och något högre p-värden än om överspridningskorrigering inte används. Att inte anta överspridning är ekvivalent med att anta φ = 1.

9 D. A. Williams, Extra-binomial Variation in Logistic Linear Models, Department of Statistics, University

(26)

14

2.2.7 Referens-­  och  effektkodning  

När det i en regressionsanalys finns kategoriska variabler måste dessa göras om till indikatorvariabler. Denna kodning kan göras på flera olika sätt och de två metoder som används i denna rapport är referens- och effektkodning. Om en variabel kodas med referenskodning anges en nivå som referensgrupp. När de skattade parametrarna beräknas jämförs de andra nivåernas värden med referensgruppens värde. En viss nivås skattning jämförs alltså med referensgruppens skattning. Om variabeln kodas med effektkodning jämförs däremot alla nivåer med en medelnivå.

Nedan visas hur kodningen har gjorts i de två regressionsanalyserna.

Kodning i Analys A

Kön Referenskodning (referensgrupp: Man)

Landgrupp Referenskodning (referensgrupp: Nordiska länder utom Sverige) Åldersgrupp Effektkodning

Årstid Effektkodning

År Effektkodning

Kodning i Analys B

Kön Referenskodning (referensgrupp: Man) Åldersgrupp Effektkodning

Årstid Effektkodning

År Referenskodning (referensgrupp: 1997)

För variabler där det är intressant att kunna jämföra de olika nivåerna med en referensgrupp väljs referenskodning. Att välja ett visst kön som referens innebär att det går att jämföra de två könen med varandra istället för att jämföra med ett ”medelkön”. Att välja år 1997 som referensår betyder att det går att jämföra hur sannolikheten att smittas förändras över tiden. Den landgrupp som valts som referensgrupp är Nordiska länder utom Sverige och de länder som ingår i denna är Norge, Danmark, Finland och Island. En jämförelse kan därför göras mellan sannolikheten att smittas om resenären reser till en viss landgrupp och sannolikheten att smittas i Nordiska länder utom Sverige. Anledningen till att Nordiska länder utom Sverige har valts som referenslandgrupp är att dessa länder är mest lika Sverige.

(27)

15

För variabler där det istället är intressant att kunna jämföra de olika nivåerna med en medelnivå väljs effektkodning. För variabeln årstid kan man på detta sätt se hur stor sannolikheten att smittas är en viss årstid i jämförelse med den genomsnittliga sannolikheten att smittas för hela året.

2.3 Databearbetning    

Databearbetning har gjorts av utdragen ur resedatabasen och SmiNet. Vissa delar av databearbetningen har gjorts i endast en av databaserna och vissa delar har gjorts i båda.

Innan databearbetningen genomfördes innehöll utdraget ur resedatabasen 45 349 rader där varje rad motsvarar en resa som den intervjuade personen har gjort. Databearbetningen som gjordes innebar delvis att vissa rader, som av någon anledning var oanvändbara, rensades bort. Detta resulterade i att utdraget ur resedatabasen efter databearbetningen innehöll 37 010 rader som sedan användes i analysen.

2.3.1 Gallring  och  gruppering   Utlandsresor  med  övernattning  

I resedatabasen finns det information om varje resa där det anges om resan är en dags- eller övernattningsresa. De enda resor som är intressanta för frågeställningarna är de resor som är av typen utlandsresa med övernattning. Av denna anledning har de resor som inte är utlandsresor och de resor som är dagsresor sorterats bort ur utdraget ur resedatabasen innan analysen har genomförts. Antalet dagsresor som sorterades bort var cirka 8 000 stycken och stod därmed för den större delen av det totala antalet bortsorterade resor.

(28)

16

Endast resor som uppfyller följande krav har använts i analysen. • Restyp = "Utland övernattning"

• Huvudsakligt besökt land ≠ "Sverige" • Antal nätter i huvudsakligt besökt land > 0

• Totalt antal övernattningar i samband med resan > 0

• Totalt antal övernattningar i samband med resan ≥ Antal nätter i huvudsakligt besökt land

I SmiNet finns från början information om sjukdomsfall som blivit smittade antingen i Sverige eller utomlands samt fall där uppgift om sannolikt smittland saknas. Endast utlandsresor och därmed utlandssmittade är intressanta för frågeställningarna. Därför har samtliga observationer där Sverige är angivet som sannolikt smittland eller där uppgift om sannolikt smittland saknas sorterats bort.

Kön  och  ålder  

I både resedatabasen och SmiNet har samtliga observationer där kön inte är angivet sorterats bort.

Rampopulationen är personer som är yngre än 75 år. Resedatabasen innehåller endast resor som har gjorts av personer som är yngre än 75 år. I SmiNet finns det däremot ingen övre åldersgräns så därför sorterades personer som är 75 år och äldre bort.

Säsong  

För att kunna genomföra analysen med det datamaterial som finns att tillgå grupperades månader till årstider: vinter, vår, sommar och höst. Nedan visas hur grupperingen gjordes.

Årstid Månader

Vinter December, januari, februari Vår Mars, april, maj

Sommar Juni, juli, augusti

(29)

17

Landgruppering  

Variabeln huvudsakligt besökt land i resedatabasen och variabeln sannolikt smittland i SmiNet har inte samma uppdelning. Till exempel anges Thailand vissa år som Malackahalvön i resedatabasen och som Thailand i SmiNet. Resedatabasen har alltså i det här fallet en grövre uppdelning. För att kunna analysera sannolikheten att smittas i olika länder krävs att länderna har samma uppdelning i båda databaserna. Därför gjordes en gemensam uppdelning där länderna i både resedatabasen och SmiNet grupperades till 16 olika landgrupper. Landgrupperna bestämdes genom att utgå ifrån grupperingen i artikeln Travel-associated non-typhoidal salmonellosis: geographical and seasonal differences and serotype distribution10. Utifrån denna delades hela jordklotet utom Antarktis och Arktis in i 16 olika geografiska områden. Se bilaga I.

I resedatabasen fanns fall där huvudsakligt besökt land saknades men där huvudsakligt besökt stad var angivet. Då ersattes huvudsakligt besökt land med det land där den angivna staden ligger. I de fall då huvudsakligt besökt land inte kunde ersättas genom att titta på huvudsakligt besökt stad, på grund av att detta inte var angivet, sorterades denna resa bort och användes inte i analysen. Även i de fall då huvudsakligt besökt land var angivet som ett för stort geografiskt område för att kunna delas in i någon av landgrupperna (till exempel Asien som är uppdelad i flera olika landgrupper) sorterades resan bort. Samma sak gjordes även i SmiNet med motsvarande variabler, sannolikt smittland och smittort.

2.3.2 Sammanfogning  av  databaserna    

Då alla bearbetningar av resedatabasen och SmiNet gjorts sammanfogas dessa två databaser. Detta görs genom att för varje kombination av kön, åldersgrupp, landgrupp, år och årstid summera det skattade antalet resnätter (antal nätter i huvudsakligt besökt land) och antalet smittade. Då representerar varje rad en kombination av kön, åldersgrupp, landgrupp, år och årstid. För varje rad finns ett värde på variabeln antal resnätter som alltså visar skattningen av det totala antalet resnätter som gjorts för

10 K. Ekdahl, B. de Jong, R. Wollin, Y. Andersson, Travel-associated non-typhoidal salmonellosis:

geographical and seasonal differences and serotype distribution, Department of Epidemiology and Bacteriology, Swedish Institute for Infectious Disease Control (SMI), Stockholm, 2004.

(30)

18

denna kombination. Det finns även ett värde på variabeln antal smittade som för varje kombination visar hur många som har blivit smittade av en viss sjukdom. Det är denna sammanfogade tabell som sedan används för analys.

2.3.3 Avrundning  av  antal  resnätter  

Variabeln antal resnätter anger det skattade antalet nätter som totalt har tillbringats på resmålet för varje kombination. Denna variabel är i decimalform då den har skapats genom att för varje resa multiplicera variablerna antal nätter i huvudsakligt besökt land med resans resvikt som i sin tur är ett decimaltal. Antal resnätter summeras för varje kombination som beskrivits ovan. Detta gör alltså att variabeln antal resnätter är i decimalform. Eftersom det i praktiken endast är möjligt att ha ett heltal som antal resnätter avrundas decimaltalet efter att summeringen per kombination har gjorts.

2.3.4 Avsaknad  av  vissa  kombinationer  i  resedatabasen  

I den sammanställda databasen har den skattade variabeln antal resnätter summerats för varje kombination av variabler. I denna databas finns det kombinationer där antal resnätter har värdet 0 och det finns två möjliga anledningar till detta. En anledning kan vara att det faktiskt inte är någon som tillhör dessa kombinationer som har rest utomlands. Alternativt beror det på att resedatabasen inte innehåller information om dessa kombinationer på grund av att resvaneundersökningen omfattar för få personer. Variabeln antal resnätter får värdet 0 då information om just den kombinationen saknas.

Antal resnätter per kombination beräknas utifrån variabeln antal nätter i huvudsakligt besökt land och variabeln resvikt. Summan av variabeln resvikt motsvarar det totala antalet resor som gjorts. Variabeln resvikt skapas genom att fem olika vikter multipliceras och en av dessa vikter är V_korrig. Enligt resedatabasens definition av variabeln V_korrig så korrigerar den decimalfel som uppstår vid framtagning av resvikten. Summan av vikten korrigeras så att den överensstämmer exakt med antalet genomförda intervjuer. När denna variabel beräknas uppstår det problem när en kombination av län, kön och ålder inte är representerad i stickprovet. En sådan korrigering utgår ifrån att hela populationen är fördelad över de kombinationer av län, kön och ålder som har kommit med i stickprovet. Om till exempel en viss kön- och

(31)

19

ålderskombination för ett visst län inte är representerat i stickprovet korrigeras det som om denna kön- och ålderskombination inte existerar i detta län. Därmed fördelas hela länets vikt över de kön- och ålderskombinationer som existerar i stickprovet för detta län. Detta resulterar i att de kombinationer som är representerade i stickprovet får för stor vikt och antal resnätter för dessa blir överskattade. Att vissa kombinationer är överskattade påverkar dock inte summan av antalet resnätter inom en viss landgrupp. Summan är fortfarande korrekt men fördelningen av antalet resor mellan de olika kombinationerna är inte korrekt.

2.3.5 Utjämning  av  antal  resnätter  

För att korrigera för att vissa kombinationer har ett överskattat antal resnätter och att vissa har ett underskattat antal görs en utjämning. Detta görs för en landgrupp åt gången för att summan av antalet resnätter inom en landgrupp inte ska påverkas. Utifrån de befintliga värdena på antal resnätter anpassas en regressionsmodell med kön, åldersgrupp, år och årstid som förklarande variabler och antal resnätter som responsvariabel. Antal resnätter anges vara poissonfördelad för att variabeln endast ska anta positiva tal.

n ~ Poisson( )

Utifrån denna modell beräknas anpassade antal resnätter per kombination. Utjämningen beskrivs här i korthet:

1. En tabell skapas som innehåller variablerna kön, landgrupp, åldersgrupp, år, årstid och antal resnätter. Variabeln antal resnätter innehåller här de ursprungliga värdena. Det finns alltså vissa kombinationer där antal resnätter har värdet 0.

2. Utifrån tabellen anpassas modellen med den poissonfördelade variabeln antal resnätter som responsvariabel.

3. De anpassade värdena på variabeln antal resnätter avrundas till heltal och sparas i en ny tabell.

Steg 1 till 3 görs för varje landgrupp. Tabellerna som skapats för varje landgrupp som innehåller anpassade värden för variabeln antal resnätter sammanfogas. De

(32)

20

ursprungliga värdena på antal resnätter i den aktuella landgruppen har nu spridits ut över alla kombinationer för landgruppen enligt modellen.

2.3.6 Osäkerhet  i  antal  resnätter  

Variabeln antal resnätter i resedatabasen visar hur många nätter resenären har tillbringat på det huvudsakliga resmålet. Denna variabel används för att beräkna sannolikheten att bli sjuk per natt. Variabeln är en skattad variabel eftersom resedatabasen bygger på ett slumpmässigt urval och därmed finns en osäkerhet i denna variabel. En sådan osäkerhet skulle kunna innebära att parametrarna i modellen inte skattas väntevärdesriktigt då modellen för antal smittade utgår från att antalet resnätter är det korrekta antalet.

För att undersöka hur en störning i variabeln antal resnätter påverkar resultatet av den logistiska regressionen har en simulering gjorts på datamaterialet. Denna simulering kontrollerar dock endast vad som händer om en ändring görs i antal resnätter för de kombinationer som ursprungligen finns med i datamaterialet. En simulering som även möjliggör för nya kombinationer att komma med skulle kunna genomföras men den simulering som utförts bedömdes vara tillräcklig.

Simulering  

För varje rad i resedata läggs en störning på i variabeln antal resnätter. Denna störning är ett slumpmässigt tal som för varje rad hämtas ur en likformig fördelning och motsvarar mellan -20 procent till 20 procent av värdet på variabeln antal resnätter per rad. Anledningen till att störningen valdes till storleken -20 procent till 20 procent av värdet på variabeln antal resnätter är att detta uppskattades vara en rimlig osäkerhetsmarginal.

En tabell med alla kombinationer av kön, landgrupp, åldersgrupp, år och årstid skapas och antal resdagar summeras per kombination.

Utjämningen av antal resnätter som beskrivs i kapitel 2.3.5 sker med hjälp av poissonregression på det nya datamaterialet med störningar. Tabellen med de utjämnade värdena sammanfogas med tabellen som innehåller sjukdomsfall. Celler som saknar värde på variablerna antal smittade eller antal resor ersätts med 0.

(33)

21

En logistisk regressionsmodell anpassas till den nya sammanfogade tabellen som innehåller variablerna kön, landgrupp, åldersgrupp, år, årstid, antal resnätter och antal smittade. Först anpassas modellen i Analys A och sedan modellen i Analys B. Startvärden för algoritmen som beräknar den logistiska regressionen anges som de sanna parameterskattningarna som erhållits från den logistiska regressionen på ursprungsdata utan störning i antal resnätter. Parameterskattningarna och standardfelen som skattas i simuleringen sparas i en tabell.

Alla steg ovan görs 100 gånger då detta uppskattas vara ett tillräckligt antal att basera slutsatsen på. Varje gång sparas de skattade parametrarna och standardfelen för regressionsanalysen med störning i antal resnätter. Till sist beräknas medelvärdena för parameterskattningarna och för standardfelen i de 100 simuleringarna. Dessa jämförs med de ursprungliga parameterskattningarna och standardfelen, vilka erhölls ur den logistiska regressionen på ursprungsdata utan störning i antal resnätter. Storleken på de eventuella skillnaderna mellan parameterskattningarna och standardfelen från regressionsanalysen utan störning i antal resnätter och regressionsanalysen med störning avgör om osäkerheten i antal resnätter är ett stort problem.

Simuleringen gav resultatet att en störning i variabeln antal resnätter inte påverkar väntevärdet eller standardfelen för parameterskattningarna från regressionen. Slutsatsen gör att variabeln antal resnätter kan användas som om den vore känd. Utjämningen kan vara en bidragande faktor till detta resultat då den korrigerar för en del av osäkerheten i antal resnätter.

(34)
(35)

23

3 Beskrivande  statistik  

I detta kapitel visas beskrivande statistik främst i textform. Tillhörande tabeller och diagram återfinns i Bilaga II.

3.1 Resedatabasen  

Den beskrivande statistiken i detta kapitel är baserat på de 37 010 undersökta resor under perioden 1997 till 2009 som finns i det bearbetade datamaterialet. Databearbetningen beskrivs i kapitel 2.3. För att de undersökta resorna som finns i resedatabasen ska motsvara hela Sveriges befolknings utlandsresor viktas dessa upp enligt kapitel 1.6.1. Efter att de undersökta resorna viktats upp med resviktsvariabeln motsvarar dessa cirka 154 000 000 resor, vilket alltså är skattningen för hur många utlandsresor som Sveriges befolkning gjort under hela tidsperioden. Den beskrivande statistiken för resedatabasen redogör för hur Sveriges befolknings utlandsresor mellan år 1997 och 2009 är uppdelade mellan år, årstider, kön, åldersgrupper och landgrupper. Mellan år 1997 och 1999 låg antalet utlandsresor per år på en jämn nivå runt 10,5 miljoner. Mellan år 2000 och 2004 ökade antalet resor per år och därefter har antalet resor legat på en stabil nivå kring 12,5 miljoner resor årligen.

Sommaren är den årstid då flest reser och under denna årstid görs 33,5 procent av alla resor. Vår- och höstresorna står för ungefär 24 procent var. Vinterresorna står för 18,2 procent av resorna och står därmed för den minsta andelen av resorna.

Männen står för 55,3 procent av resorna. Det är alltså något större andel män än kvinnor som har rest under perioden 1997 till 2009.

Resenärer i åldern 30-44 år och 45-59 står för den största andelen av resorna. Tillsammans står de för 52,0 procent av alla utlandsresor. Resenärer i åldern 0-14 år och 60-74 år står för de minsta andelarna av resorna.

Majoriteten av utlandsresorna görs inom Europa. Resor till landgrupperna Nordiska länder utom Sverige och Västeuropa står för över hälften av det totala antalet utlandsresor. Bland de utomeuropeiska landgrupperna är det Östasien och

(36)

24

Nordamerika som står för den största andelen av resorna. Den landgrupp som står för den minsta andelen av resorna är Indien och grannländer.

3.2 SmiNet  

I denna del redovisas antalet fall av de fyra sjukdomarna med olika uppdelningar. Eftersom denna rapport fokuserar på utlandssmittade fall så är det endast dessa fall som är intressanta. För att ett fall i SmiNet ska kunna användas i analysen måste det därför finnas uppgift om variabeln sannolikt smittland och det sannolika smittlandet får inte vara Sverige. Därför visas diagram för variabeln sannolikt smittland där det redovisas hur stor andel av fallen som saknar uppgift om sannolikt smittland och hur stor andel som är smittade i Sverige. Dessa två grupper kan alltså inte användas i analysen. Diagram 3.2.1 till 3.2.4 visar de inrapporterade fallen av Campylobacter, Giardia, Salmonella och Shigella för de 13 åren uppdelat i tre grupper:

• Utland – Uppgift om sannolikt smittland finns. Det sannolika smittlandet är angivet som utland. Det är alltså endast dessa observationer som analyseras i kapitel 4.

• Sverige – Uppgift om sannolikt smittland finns. Det sannolika smittlandet är Sverige.

• Uppgift saknas – Ingen uppgift om sannolikt smittland finns.

Diagram 3.2.1 Uppgift om sannolikt smittland för campylobacterinfektion från 1997 till 2009.

0%   10%   20%   30%   40%   50%   60%   70%   80%   90%   100%   År  

Campylobacter  -­‐  Sannolikt  smi5land  

Utland   Sverige   Uppgi;  saknas  

(37)

25

För Campylobacter finns det en nedåtgående trend för andelen fall där uppgift om sannolikt smittland saknas. Den totala andelen där sannolikt smittland saknas för de 13 åren är 9,1 procent.

I diagram 3.2.2 visas andelarna i de tre grupperna för Giardia.

Diagram 3.2.2 Uppgift om sannolikt smittland för giardiainfektion från 1997 till 2009.

Även för Giardia är det möjligt att se att andelen där uppgiften saknas blivit mindre med tiden. Totalt sett saknar 16,0 procent av fallen för åren 1997 till 2009 uppgift om sannolikt smittland. Giardia är därmed den sjukdom där sannolikt smittland totalt sett saknas i flest fall av de fyra sjukdomarna som analyseras i rapporten.

0%   10%   20%   30%   40%   50%   60%   70%   80%   90%   100%   År  

Giardia  -­‐  Sannolikt  smi5land  

Utland   Sverige   Uppgi;  saknas  

(38)

26

Andelen smittfall där uppgift om sannolikt smittland är angett som utland, Sverige eller där uppgift saknas för Salmonella visas i diagram 3.2.3.

Diagram 3.2.3 Uppgift om sannolikt smittland för salmonellainfektion från 1997 till 2009.

Andelen där uppgift om sannolikt smittland saknas har under de 13 åren varit relativt låg för Salmonella i jämförelse med Campylobacter och Giardia. För hela perioden har andelen understigit 10 procent. Totalt sett är det 3,9 procent av fallen som saknar uppgift om sannolikt smittland.

Diagram 3.2.4 visar andelarna i de tre grupperna för Shigella.

Diagram 3.2.4 Uppgift om sannolikt smittland för shigellainfektion från 1997 till 2009.

0%   10%   20%   30%   40%   50%   60%   70%   80%   90%   100%   1997  1998  1999  2000  2001  2002  2003  2004  2005  2006  2007  2008  2009   År  

Salmonella  -­‐  Sannolikt  smi5land  

Utland   Sverige   Uppgi;  saknas   0%   10%   20%   30%   40%   50%   60%   70%   80%   90%   100%   År  

Shigella  -­‐  Sannolikt  smi5land  

Utland   Sverige   Uppgi;  saknas  

(39)

27

Shigella är den av de fyra sjukdomarna som har den lägsta andelen fall där uppgift om sannolikt smittland saknas. Endast 3,3 procent av alla de fall som inrapporterades mellan åren 1997 till 2009 saknar uppgift om sannolikt smittland.

3.2.1 Beskrivande  statistik  för  utlandssmittade  fall  

Den beskrivande statistiken som följer är uppdelad på de fyra olika sjukdomarna och baseras endast på de fall som finns i det bearbetade datamaterialet. I detta kapitel är alltså endast utlandssmittade fall där personen är yngre än 75 år beskrivna. Databearbetningen beskrivs i kapitel 2.3.

I tabell 3.2.1 visas antalet utlandssmittade fall av de fyra olika sjukdomarna under hela tidsperioden mellan år 1997 och 2009.

Tabell 3.2.1 Antal utlandssmittade fall med Campylobacter, Giardia, Salmonella och Shigella mellan år 1997 och 2009.

Campylobacter  

Antalet inrapporterade fall med campylobacterinfektion per år har varierat mellan år 1997 och 2009. År 1997 inrapporterades 3 177 fall och detta är därmed det år med lägst antal fall med campylobacterinfektion. Det år som hade flest antal inrapporterade fall är 2008 med 5 187 inrapporterade fall.

Fördelningen mellan män och kvinnor var någorlunda jämn men något fler män rapporterades smittade med campylobacterinfektion.

Personer i åldersgruppen 15-29 år står för den största andelen smittade med 31,0 procent av det totala antalet utlandssmittade fall. Åldersgrupperna 0-14 år och 60-74 år står för de minsta andelarna med 8,3 procent respektive 9,3 procent.

Sjukdom   Antal  smittade  

Campylobacter   54  083   Giardia   12  308   Salmonella   41  514   Shigella   5  082  

(40)

28

De fyra landgrupper som står för den största andelen av fallen är Östasien, Sydeuropa, Östra medelhavet och Norra Afrika. 69,9 procent av de fall som är inrapporterade i SmiNet har smittats i dessa landgrupper.

Giardia  

Under den första delen av tidsperioden låg antalet fall per år på en relativt jämn nivå. Från år 2005 och framåt har antalet fall ökat. 1 212 fall rapporterades in år 2008 och detta är därmed det år med flest fall.

Något fler män än kvinnor rapporterades smittade med giardiainfektion.

Ett tydligt åldersmönster kan utläsas från diagram Åldersfördelning för giardiainfektion för perioden 1997 till 2009 i Bilaga II. Ju lägre ålder desto större är andelen av det totala antalet utlandssmittade fall. Andelen är absolut störst för den yngsta åldersgruppen, 0-14 år, som står för 48,9 procent av fallen. Allra lägst är andelen för åldersgruppen 60-74 år, vilken står för 4,2 procent av fallen.

De fyra landgrupper som står för den största andelen fall är Arabländerna och Iran, Norra Afrika, Indien och grannländer samt Östasien. Dessa länder står för 69,5 procent av det totala antalet utlandssmittade fall.

Salmonella  

Antalet inrapporterade fall med salmonellainfektion låg mellan år 1997 och 2001 på en stabil nivå på runt 3 700 inrapporterade fall årligen. Därefter skedde en minskning i antalet inrapporterade fall och från år 2002 har antalet fall legat på en jämn nivå med cirka 2 900 fall per år.

Antalet fall med salmonellainfektion är jämnt fördelat mellan kvinnor och män.

Åldersgrupperna 15-29 år, 30-44 år och 45-59 år står för de största andelarna av fallen. Den yngsta och den äldsta åldersgruppen står för de två minsta andelarna.

Östasien, Sydeuropa, Östra medelhavet och Norra Afrika är de fyra landgrupperna som står för de största andelarna av fallen. Tillsammans står de för 77,8 procent av de inrapporterade fallen.

(41)

29

Shigella  

Antalet fall med shigellainfektion varierar mycket från år till år. Det år med flest antal inrapporterade fall med shigellainfektion är år 1997. Detta år inrapporterades 464 fall. År 2003 rapporterades endast 297 fall in och detta är därmed det år med lägst antal fall.

Till skillnad från de övriga tre sjukdomarna finns det för shigellainfektion en tydlig skillnad vad gäller fördelningen av antal fall mellan kvinnor och män. Kvinnor står för 58,1 procent av fallen och männen står för 41,9 procent.

Fördelningen är relativt jämn mellan åldersgrupperna. De åldersgrupper som står för störst andelar av antalet fall är 15-29 år, 30-44 år och 45-59 år. Dessa står för cirka 25 procent var.

Norra Afrika är den landgrupp som står för den största andelen av fallen, nämligen 39,7 procent. Denna landgrupp, tillsammans med Indien och grannländer, Östra medelhavet samt Östasien står för 75,6 procent av det totala antalet utlandssmittade fall med shigellainfektion.

(42)
(43)

31

4 Resultat  

I detta kapitel beskrivs resultatet av de logistiska regressionsanalyserna. I Analys A redovisas för varje sjukdom resultatet av den logistiska regressionen för variablerna kön och landgrupp. I Analys B är det istället resultatet för variablerna åldersgrupp, år och årstid som redovisas. Analys B är genomförd för de fyra landgrupper med flest antal smittade inom varje sjukdom.

Kolumnen Parameter visar vilken variabel som raden handlar om. Kolumnen intill visar vilken nivå av variabeln som redovisas. I de efterföljande kolumnerna visas resultatet av den logistiska regressionen.

Oddskvoten är oddset för en nivå (till exempel Arabländerna och Iran) dividerat med oddset för referensgruppen (Nordiska länder utom Sverige). Är oddskvoten 1 är oddset samma för nivån som analyseras och referensgruppen.

P-värdet är sannolikheten att få det utfall man fått eller ett mer extremt utfall givet att nollhypotesen är sann. Hypoteserna är:

H0: βi = 0

H1: βi ≠ 0

 

Ett p-värde under 0,05 leder till att nollhypotesen förkastas. Då kan slutsatsen att parametern är skild från 0 dras med 95 procents säkerhet. Att parametern är skild från 0 är ekvivalent med att oddskvoten är skild från 1.

Till sist redovisas ett 95-procentigt konfidensintervall för oddskvoten.

För små sannolikheter kan oddskvoten tolkas som den relativa risken. Detta på grund av att nämnaren i uttrycket som räknar ut oddset blir nära 1 då sannolikheten är liten.

(44)

32

Riskerna att smittas per natt av sjukdomarna som analyseras i rapporten är tillräckligt små för att approximera oddskvoterna med relativa risker. Approximativt är alltså oddskvot ≈ relativ risk och av den anledningen kommer oddskvoterna i detta avsnitt att tolkas som relativa risker.

4.1 Analys  A    

Nordiska länder utom Sverige är angivet som referensgrupp i Analys A. För enkelhets skull kommer denna landgrupp att refereras till som Norden i detta kapitel. Det är dock viktigt att understryka att Sverige inte ingår i denna landgrupp. Variabeln kön är referenskodad med Man som referensgrupp.

4.1.1 Campylobacter  

Risken att smittas per natt av Campylobacter kan jämföras för olika nivåer utifrån oddskvoterna som redovisas i tabell 4.1.1.

Tabell 4.1.1 Analys A för campylobacterinfektion.

Parameter     Oddskvot   P-­‐värde   95  %  Konfidens  intervall  

Kön   Kvinna   1,098   <,0001   1,071   1,127  

Landgrupp   Arabländerna  och  Iran   17,042   <,0001   14,141   20,538  

Landgrupp   Australien,  Nya  Zeeland  och   1,084   0,6107   0,794   1,482  

Landgrupp   Centralamerika   7,332   <,0001   6,001   8,959  

Landgrupp   Indien  och  grannländer   158,289   <,0001   134,126   186,797  

Landgrupp   Nordamerika   0,404   <,0001   0,285   0,573  

Landgrupp   Norra  Afrika   51,796   <,0001   43,984   60,993  

Landgrupp   Ryssland  och  forna  Sovjetuni   9,570   <,0001   7,554   12,125  

Landgrupp   Sydamerika   28,065   <,0001   23,540   33,459  

Landgrupp   Sydeuropa   8,940   <,0001   7,560   10,574  

Landgrupp   Södra  Afrika   12,008   <,0001   9,739   14,803  

Landgrupp   Västeuropa   4,145   <,0001   3,471   4,949  

Landgrupp   Östasien   33,201   <,0001   28,200   39,090  

Landgrupp   Östeuropa   12,474   <,0001   10,485   14,839  

Landgrupp   Östra  Medelhavet   9,289   <,0001   7,831   11,018  

Risken att smittas per natt av Campylobacter är något större för kvinnor än för män. Den landgrupp där risken att smittas är störst är Indien och grannländer. Risken är där 160 gånger större än risken i Norden. Nordamerika är den enda landgrupp där risken att smittas är lägre än vad den är i Norden. P-värdet för landgruppen Australien, Nya

(45)

33

Zeeland och öarna är större än 0,05. Detta innebär att det inte går att statistiskt säkerställa att risken för denna landgrupp skiljer sig från risken i Norden.

4.1.2 Giardia  

Oddskvoterna för Giardia visas i tabell 4.1.2.

Tabell 4.1.2 Analys A för giardiainfektion.

Parameter     Oddskvot   P-­‐värde   95  %  Konfidens  intervall  

Kön   Kvinna   0,945   0,0687   0,890   1,004  

Landgrupp   Arabländerna  och  Iran   647,233   <,0001   219,676   1906,926  

Landgrupp   Australien,  Nya  Zeeland  och   3,884   0,0418   1,052   14,344  

Landgrupp   Centralamerika   53,493   <,0001   17,899   159,885  

Landgrupp   Indien  och  grannländer   1438,405   <,0001   488,117   4238,836  

Landgrupp   Nordamerika   2,682   0,1315   0,744   9,663  

Landgrupp   Norra  Afrika   244,543   <,0001   82,871   721,632  

Landgrupp   Ryssland  och  forna  Sovjetuni   209,680   <,0001   70,751   621,433  

Landgrupp   Sydamerika   315,342   <,0001   106,679   932,230  

Landgrupp   Sydeuropa   3,639   0,0374   1,078   12,281  

Landgrupp   Södra  Afrika   87,866   <,0001   29,404   262,555  

Landgrupp   Västeuropa   2,149   0,2518   0,581   7,949  

Landgrupp   Östasien   68,780   <,0001   23,171   204,158  

Landgrupp   Östeuropa   29,240   <,0001   9,708   88,058  

Landgrupp   Östra  Medelhavet   33,683   <,0001   11,263   100,730  

För giardiainfektion kan ingen skillnad i risk mellan kvinnor och män säkerställas. Risken att smittas i Indien och grannländer är 1 440 gånger så stor som i Norden. Norden, Västeuropa och Nordamerika är de tre landgrupper där risken att smittas är lägst.

(46)

34

4.1.3 Salmonella  

I tabell 4.1.3 visas resultatet av Analys A för Salmonella.

Tabell 4.1.3 Analys A för salmonellainfektion.

Parameter     Oddskvot   P-­‐värde   95  %  Konfidens  intervall  

Kön   Kvinna   1,121   <,0001   1,090   1,154  

Landgrupp   Arabländerna  och  Iran   23,068   <,0001   17,735   30,001  

Landgrupp   Australien,  Nya  Zeeland  och   0,967   0,8952   0,587   1,592  

Landgrupp   Centralamerika   20,197   <,0001   15,644   26,073  

Landgrupp   Indien  och  grannländer   127,239   <,0001   99,691   162,409  

Landgrupp   Nordamerika   0,545   0,0085   0,347   0,857  

Landgrupp   Norra  Afrika   97,646   <,0001   77,101   123,653  

Landgrupp   Ryssland  och  forna  Sovjetuni   20,810   <,0001   15,487   27,960  

Landgrupp   Sydamerika   23,675   <,0001   18,213   30,773  

Landgrupp   Sydeuropa   17,886   <,0001   14,079   22,722  

Landgrupp   Södra  Afrika   17,815   <,0001   13,382   23,719  

Landgrupp   Västeuropa   3,324   <,0001   2,552   4,331  

Landgrupp   Östasien   64,163   <,0001   50,674   81,238  

Landgrupp   Östeuropa   26,489   <,0001   20,732   33,842  

Landgrupp   Östra  Medelhavet   15,338   <,0001   11,998   19,607  

Risken att smittas av salmonellainfektion är ungefär 10 procent större för kvinnor än för män. Risken att smittas är även för Salmonella störst i Indien och grannländer. För denna landgrupp är risken 130 gånger så stor som risken att smittas i Norden. Nordamerika är den enda landgrupp där risken att smittas med säkerhet är mindre än risken i Norden. Flera landgruppers oddskvoter ligger runt 20 vilket innebär att många landgrupper har en smittorisk som är 20 gånger större än risken i Norden.

References

Related documents

Den kategoriseringsprocess som kommer till uttryck för människor med hög ålder inbegriper således ett ansvar att åldras på ”rätt” eller ”nor- malt” sätt, i handling

Mme Yvonne Grubenmann a comparé l'édition à un manuscrit qu'a utilisé Tourneux et qui se trouve dans la Bibliothèque de l'Arsenal, à Paris.. Elle a trouvé des

Hitta två stenar, en liten och en stor, 
 krama någon som

Uppsiktsansvaret innebär att Boverket ska skaffa sig överblick över hur kommunerna och länsstyrelserna arbetar med och tar sitt ansvar för planering, tillståndsgivning och tillsyn

Förslag till nyckeltal Ett komplement till de befintliga nyckeltalen för samhällsbuller skulle kunna vara hur många människor som är störda av buller som alstras inom byggnaden,

1(1) Remissvar 2021-01-22 Kommunledning Nykvarns kommun Christer Ekenstedt Utredare Telefon 08 555 010 97 christer.ekenstedt.lejon@nykvarn.se Justitiedepartementet

Protokoll fort den lOjuli 2020 over arenden som kommunstyrel- sens ordforande enligt kommun- styrelsens i Sodertalje delegations- ordning har ratt att besluta

Zink: För personer med tillräckliga nivåer av zink i cellerna visade analysen att risken för att insjukna i COVID-19 minskade med 91 procent.. Brist på zink innebar istället