Örebro universitet
Handelshögskolan
Statistik C, Kandidatuppsats 15p
Handledare: Nicklas Pettersson
Examinator: Niklas Karlsson
VT 2015
Datainsamlingsmetoder för statistiska undersökningar
-en beskrivande litteraturstudie
Jenny Malmkvist
Sammanfattning
Uppsatsen beskriver insamlingsmetoders funktion utifrån samhällets förutsättningar.
Metodval för statistiker diskuteras med betoning på variablerna tidsram och ekonomi. För att förstå framtidens behov beskrivs bakomliggande incitament som styrt utveckling av
metoderna. Designen är en ”beskrivande litteraturstudie” grundad på litteratur från kursplaner.
Nutidens befolkning är misstänksamma mot telefonintervjuare och känner inte samma samhällsansvar att bidra till en undersökning som förr. Nyare insamlingsmetoder tar hänsyn till individers olika behov i populationen och gynnar betydelsefulla variabler. Slutsatser är att tekniska utvecklingen har varit drivkraft till förändringar av insamlingsmetoder, men också skapat en beteendeförändring hos populationen att ta hänsyn till. Litteraturen ger bra insikt i ämnet och universiteten har ett brett kursutbud på avancerad nivå.
Innehållsförteckning 1 Inledning ... 1 1.1 Syfte ... 1 1.2 Val av metod ... 2 1.3 Avgränsningar ... 2 1.4 Bakgrund ... 2 1.5 Disposition... 3 2 Metod ... 3 3 Material ... 4 4 Resultat ... 5 4.1 Historia år 1700- 1970 ... 5
4.1.1 Paper and pencil interviewing (PAPI) ... 6
4.1.2 Mail survey ... 6
4.2 Nutid- från år 1970 ... 6
4.2.1 Computer-assisted telephone interviewing (CATI) ... 7
4.2.2 E-Mail survey ... 8
4.2.3 Diary survey ... 8
4.2.4 Computer-assisted self-interviewing (CASI), Audio CASI (ACASI) och Telephone ACASI (T-ACASI) ... 8
4.2.5 Electronic data interchange (EDI) ... 9
4.2.6 Disk by mail (DBM) och Electronic mail survey (EMS) ... 9
4.2.7 Touch-tone data entry (TDE) ... 10
4.2.8 Voice recognition entry (VRE) ... 10
4.2.9 Direct observations ... 10
4.3 Från nutid till framtid ... 11
4.3.1 Register-based statistics ... 11
4.3.2 Mixed modes ... 11
4.3.3 Tailored/ Adaptive design ... 12
4.3.4 Unimode construction ... 12
5 Slutsats och diskussion ... 13 Källförteckning
1 Inledning
Inom statistikproduktion behövs väl fungerande insamlingsmetoder för att skapa tillförlitlig data för en undersökning. Lagstadgat ska officiell statistik finnas tillgänglig för utredningar, forskning och för allmän information. SCB (Statistiska central byrån) ansvarar
sektorsövergripande för Sveriges officiella statistik. (Scb.se) Andra användningsområden för insamlingsmetoder är exempelvis vid opinionsundersökningar och enskilda företags
intresseundersökningar. Denna uppsats ger kunskap om metoderna och visar en förklaring som jag önskar kunna intressera andra statistiker. I arbetslivet är ekonomi och tidsåtgång viktiga variabler att ta hänsyn till och tankar om metodval diskuteras.
Telefonintervjuer har varit ledande insamlingsmetod sedan 1970-talet och används än idag. Mejlenkäter hör till gruppen självadministrerande metoder som förutspås öka i framtiden (Dillman 2007). Telefonintervjuare behöver övertyga om sin trovärdighet eftersom nutidens befolkning visar misstänksamhet mot okända samtal. Även länkar i e-mail misstros av rädsla för SPAM. (DeLeeuw, Hox & Dillman 2008) Ett skifte har återigen skapats av teknikens utveckling och nya metoder behövs, för att förstå framtidens behov beskrivs bakomliggande incitament som styrt metodutvecklingen. Sammanställningen i denna uppsats har jag inte funnit i tidigare studier och ämnet har endast berörts under mina egen utbildning, för inblick i utbildningsutbudet hämtas litteraturen från kursplaner.
1.1 Syfte
Syftet med denna uppsats är att beskriva insamlingsmetodernas funktion, med hänsyn till betydande variabler vid metodval. För inblick i framtidens behov beskrivs drivkrafter som styrt förändringar av metoderna. Uppsatsen grundas på utbildningsmaterial från Svenska universitet för att ta reda på vad som lärs ut inom ämnet.
Frågeställning: Hur beskrivs insamlingsmetoders funktion och bakomliggande drivkrafter för förändring, inom Svensk kurslitteratur?
1.2 Val av metod
Designen ”beskrivande litteraturstudie” väljs eftersom uppsatsen grundas på litteratur som läses och kommenteras. Litteratur söks från kurser som ges av Svenska universitet för att sedan kompletteras med det jag hittar från senare forskning.
1.3 Avgränsningar
Kursplaner för litteratursökning begränsas till kurser i ämnet statistik, med anknytning till undersökningsmetodik. Kurserna ges av Svenska universitet och främst på avancerad nivå. Kursplanerna har varit aktuella under de senaste åtta åren.
Litteraturen är mestadels på engelska så engelska namn på insamlingsmetoderna väljs för denna uppsats, översättningar stämmer inte överens med dagligt tal. Vid källhänvisningar av litteraturen belyses den/ de författare som skrivit en förklarande text, slutsats eller egen åsikt. I flera fall har författarna skrivit liknande texter, hänvisning ges till den jag finner mest intressant.
1.4 Bakgrund
Behov av att samla in data för statistiska undersökningar har funnits sedan 1700-talet men metoderna har förändrats med samhällets utveckling. En betydande förändring skedde med teknikens skifte på 1970-talet när telefonintervjuerna blev ledande insamlingsmetod. (Biemer 2003) Dillman (2007) anser att nästa skifte av teknikens framfart skapats och nya metoder återigen behövs.
Fasta telenätet är inte lika pålitligt register som förr och färre människor äger fast telefon. Många förlitar sig på sina mobiltelefoner som för statistikern har osäkra registerdata. Människor idag är misstänksamma mot okända samtal. Tidsbristen i dagens stressade
samhälle gör att befolkningen inte tar sig tillfälle att svara på en telefonintervju eller fylla i en längre enkät, deltagande i undersökningar minskar och bortfallen ökar. (Erikson, Haraldsen & Snijkers 2012) Även självadministrerande metoder behöver överbrygga denna misstro, människor vågar inte följa en länk i ett mail av rädsla för SPAM och det blir allt svårare för
telefonintervjuare att få trovärdighet. Befolkningens känner inte samhällsansvar som förr att bidra med svar på en undersökning. (DeLeeuw, Hox & Dillman 2008) Groves, Fowler Jr, Couper, Lepkowski, Singer och Tourangeau (2004) anser att förståelse av
insamlingsprocessen är betydande för ett tillförlitligt slutresultat.
1.5 Disposition
I metodavsnittet beskrivs hur litteraturen sökts och hanterats, sedan listas böcker i tabellform under material. Resultatdelen beskriver insamlingsmetoderna i kronologisk ordning, från historia till framtid. Metodernas funktion beskrivs, viktiga variabler för metodval och bakomliggande incitament lyfts fram. Uppsatsen avslutas med diskussion om syftet, utbildningsutbud och litteraturen.
2 Metod
Sökning på antagning.se visade att Stockholms universitet och Örebro universitet ger kurser i ämnet statistik med anknytning till undersökningsmetodik. Kursplanerna hämtades från universitetens hemsidor, kontakt med lärare1 behövdes för kursplaner som inte gick att finna på internet. Aktuella kurser fanns till största del på avancerad nivå, det passade bra då uppsatsen ska vara en fördjupning av tidigare kunskaper och hela Sveriges utbud av utbildning inom aktuell surveymetodik och registerstatistik täcks in. Litteraturen hämtades från kursplanerna och kompletterades sedan med forskning. Valda delar av litteraturen lästes, även kursernas lärandemål lästes för insikt i utbildningsutbudet.
3 Material
Tabell 1: Aktuell litteratur för denna uppsats listas i tabellen nedan med författare och utgivningsår. I de högra spalterna visas universitet med tillhörande kurs där boken används som undervisningsmaterial.
Författare År Titel Lärosäte Kurs
Biemer och Lyberg 2003 Introduction to Survey Quality Stockholms universitet Introduktion till surveykvalitet Surveymetodik DeLeeuw, Hox och Dillman 2008 International Handbook of Survey Methodology Stockholms universitet Surveymetodik
Dillman 2007 Mail and internet surveys: The tailored design method
Stockholms universitet
Surveymetodik (enbart år 2007, referenslitteratur)
Groves. et al. 2004 Survey methodology Stockholms
universitet Surveymetodik (enbart år 2007) Särndal Swensson och Wretman
1992 Model Assisted Survey Sampling Örebro universitet Urvalsteori Undersökningsmeto dik (referenslitteratur) Wallgren och Wallgren
2007 Register based Statstics: Administrative Data for Statistical Purposes. Stockholms universitet Örebro universitet Statistiska databaser och register Registerbaserad statistik
4 Resultat
Tre grundläggande insamlingsformer av data omfattas. Urvalsundersökning och totalundersökning hör båda till surveymetodik och bygger på etablerade teorier t.ex.
sannolikhetsteorin. De flesta insamlingsmetoderna hör till denna metodik. Registerstatistik har inga väletablerade teorier vilket försvårar utvecklingen (Wallgren & Wallgren 2007).
Indelning av resultatet sker i kronologisk ordning från 1700-tal för att sedan avslutas med det senaste inom forskningen. Insamlingsmetoderna beskrivs samt vilka variabler som påverkar, drivkrafterna för förändring belyses.
4.1 Historia år 1700- 1970
Författarna ger samma bild av historiken, Biemer och Lyberg (2003) beskriver den mest utförligt.
Intresset för insamlingsmetoder startade under 1700-talet när Europeiska länders styrande behövde veta populationsstorlek i landet. När Sveriges regering upptäckte ett lägre
invånarantal än väntat, hemlighölls detta av rädsla för överfall av andra länder. Graunt och Eden var i England först med en metod för estimering av populationstotaler. Metoden “Political arithmetic” använde variabler som medelvärden av antal födda, familjestorlekar m.m., senare visades att metoden var nära rätt slutresultat. På denna tid användes främst personliga intervjuer för datainsamlandet. (Biemer & Lyberg 2003) Första dokumenterade undersökningen skickades ut via postenkäter år 1788, den hade noll procent bortfall efter 23 påminnelser (DeLeeuw 2005).
I början av 1900-talet diskuterades styrkor och svagheter för enkäter som användes under personliga intervjuer. Numeriska skalor utvecklades för att underlätta bearbetningen av enkäterna. Tankar om intervjuteknik och social bias uppkom först på sent 1900-tal, åtgärder presenterades för att förebygga social bias men mycket kvarstod. (Biemer & Lyberg 2003) Än idag anser författarna att de svarande ses som hinder, främst under lagstadgade
process, and this attitude can also be seen today in some survey programs, especially in some of those that are backed up by laws stimulating mandatory participation.” (Biemer & Lyberg 2003, s. 11) Biemer (2003) anser att flera grundläggande problem som skapar olika former av bias kvarstår idag, kvalitén behöver förbättras inom surveymetodik.
4.1.1 Paper and pencil interviewing (PAPI)
Intervjuare reser till svarande och metoden möjliggör längre anpassade intervjuer. En av de första insamlingsmetoderna, genererar bra data men är tidskrävande och kostsam. Intervjuare behöver utbildning inom frågeteknik, bemötande m.m. för minimering av social bias.
Metoden ger generellt lågt bortfall. (Biemer & Lyberg 2003)
4.1.2 Mail survey
Enkäter skickas via post med frankerade kuvert för återsändning. Metoden når många
svarande samtidigt, är kostnadsminimerande och social bias försvinner. Utrymme finns för ett flertal frågor och information kan medfölja vid behov, svarande bestämmer tiden för ifyllnad av enkäten. Metoden genererar stort bortfall och eftersom flera påminnelseutskick skickas ut förlängs tidsperioden. Om fler uppdragsgivare går ihop med frågor på samma enkät kallas det Omnibus undersökning. (Dahmström 2011)
4.2 Nutid- från år 1970
Ett tekniskt skifte gynnade metodutvecklingen, undersökningarnas tidsram och kostnad minskades, insamlad data blev tillförlitligare. Metoder som uppkom är fortfarande gångbara på 2000talet.
Användandet av telefonintervjuer fick nu genomslagskraft när telenätet brett ut sig (Biemer & Lyber 2003). Dataprogram uppkom för enklare användande, CATI (se tab. 2) minskade “keypunching” (användande av tangentbord) andra program ringde slumpmässiga nummer eller skapade
uppringningsscheman m.m. Den främsta metoden för att genomföra opinionsundersökningar av större omfattning var före 1970-talet personliga intervjuer och efter 1970-talet telefonintervjuer. (Dillman 2007)
Tabell 2: I tabellen listar Biemer (2003) de mest aktuella insamlingsmetoderna för enkel översikt. Tabellen visar metodernas funktion gällande intervjuarens medverkan, kontakt med svarande och grad av datorstöd.
High Data Collector Involvment Low Data Collector Involvment
Paper Computer Paper Computer
Direct contact with respondent
Face-to-face (PAPI)
CAPI Diary CASI, ACASI
Indirect contact with respondent
Telephone (PAPI) CATI Mail, fax, e-mail TDE, e-mail, Web, DBM, EMS, VRE No contact with respondent Direct observation CADE Administrative records EDI
" ACASI, audio CASI; CADE, computer-assisted data entry; CAPI, computer-assisted personal interviewing; CASI, computer-assisted self-interviewing; CATI, computer-assisted telephone interviewing; DBM, disk by mail; EDI, electronic data interchange; EMS,
electronic mail survey; PAPI, paper-and-pencil interviewing; T-ACASI, telephone ACASI; TDE, touch-tone data entry; VRE, voice recognition entry. (Biemer & Lyberg 2003, s. 189)
4.2.1 Computer-assisted telephone interviewing (CATI)
Intervjuaren ringer upp svarande. En stor anledning att metoden fick genomslagskraft är att den sänkte kostnader. Risken är mindre för social bias jämförelsevis med personliga intervjuer men det är ej möjligt att använda sig av visuella hjälpmedel (ex. diagram, tabeller). Mejla i förväg skulle innebära en komplicerad process. Intervjuerna bör vara kortare och innehålla färre svarsalternativ. Det har uppkommit att svarande anstränger sig mindre jämfört med personliga intervjuer. Fler svar ges av, ingen åsikt eller val av extremvärden. Men som
diskuterat tidigare har denna metod många fördelar och fungerat främst av insamlingsmetoder i många år. (Biemer & Lyberg 2003)
4.2.2 E-Mail survey
Enkäten skickas till svarande via mejl. Användandet har ökat de senaste tjugo åren, främst av ett ekonomiskt perspektiv. Skillnad från tidigare metoder är att svarande inte har kontakt med intervjuare för möjliga frågor, metoden är så kallat självadministrerande. Eftersom social bias försvinner i denna metod lämpar den sig bra för frågor gällande känslig information. Synlig hjälp kan ges via extra formulär med information men det är viktigt att enkäterna är lätta att förstå och navigera sig i. Svarande kan ta sin tid utan att någon väntar och kolla upp
information vid behov. Vetskapen om varför enkäterna inte returneras saknas, metoder för bortfallshantering blir svåra att använda. (Biemer & Lyberg 2003)
4.2.3 Diary survey
Svarande antecknar information om levnadsvanor t.ex. träning, resor och kostnader, under en vald tidsperiod. Svarandes engagemang krävs och antecknandet blandas med minst två personliga intervjuer, när materialet erhålls och samlas in, för att erbjuda hjälp vid behov. En lämplig metod för känsliga frågor. Risker för bias är, telescoping som innebär att mindre rapporteras med tidens gång, risk finns för att svarande helt tröttnar, även glömska ökar med tidsperioden. Under insamlandet kan svarande ändra sina levnadsvanor sedan finns risker för säsongsskillnader på året. (Biemer & Lyberg 2003)
4.2.4 Computer-assisted self-interviewing (CASI), Audio CASI (ACASI) och Telephone ACASI (T-ACASI)
Även dessa metoder lämpar sig bra vid känsliga frågor när ingen intervjuare är inblandad. Fick genomslagskraft i slutet på 1990-talet av att kombinera fördelarna från personlig intervju, självadministrerande och datastöd. Vid användandet av CASI kan fortfarande undersökningens frågor ställas av en intervjuare men sedan via dator vid känsligare frågor. ACASI underlättar läs och skrivförståelse, frågorna läses upp och svaren besvaras med förprogrammerade tangenter. Denna metod kan i vissa fall minska underrapportering från svarande gällande känsliga frågor jämfört med både personliga och självadministrerande intervjuer. Nackdelen med CASI och ACASI är att intervjuaren måste komma med aktuell dator till svarande och vänta medan intervjun genomförs. Med TACASI sker intervjun istället
över telefon, den enda skillnaden mot TDE (tonvalsuppringning) är att intervjuaren inleder intervjun. (Biemer & Lyberg 2003)
4.2.5 Electronic data interchange (EDI)
Användning av data ifrån redan befintliga databaser är kostnadsminimerande och sparar tid av minskad insamlingsprocess. Problemet är att både berörda företag och utvecklarna av
mjukvara behöver använda ett format som tillåter insamlingsföretag att komma åt data. Men skulle detta gå att standardisera skulle processen förenklas avsevärt. (Biemer & Lyberg 2003)
4.2.6 Disk by mail (DBM) och Electronic mail survey (EMS)
En diskett med frågeformulär skickas till svarande via post, svarande fyller i enkäten på dator, sparar svaren och skickar tillbaka disketten till företaget. Fungerar liknande intervju med datastöd men minskar både kostnad och bias då ingen intervjuare är inblandad. Vid
elektronisk mejlenkät skickas istället frågeformuläret via mejl. Metoden fungerar liknande postdiskett förutom att internet ger mer möjligheter till att utforma enkäten. Problem med tillgänglig fungerande mjukvara skapar svårigheter i utformningen av frågeformulär för båda metoderna. E-mail byts ofta eller en ägare innehar flera adresser så inget pålitligt register finns. Datorer kan inneha fel, för lite utrustning eller begränsad tillgång till internet så
täckningsfel skapas. Sekretessen kan vara svår att upprätthålla. Positivt med dessa metoder är att mätningsfel minskar i förhållande till postenkäter. Individer med olika levnadsförhållanden nås lättare. Bortfallen minskar och det har visat sig att individer ger mer genomtänkta svar i enkäterna. (Biemer & Lyberg 2003)
4.2.7 Touch-tone data entry (TDE)
Svarande ringer upp och får frågorna upplästa av en dator, när som helst på dygnet, sedan ges svaren via telefonens knappsats. En använd metod idag för olika ändamål men vid
undersökningar lämpar den sig till kortare enkäter där svaren kan kodas numeriskt. Kostnaden är låg men fungerar enbart på korta enformiga undersökningar. (Biemer & Lyberg 2003)
4.2.8 Voice recognition entry (VRE)
Skillnaden jämfört med tonvalsuppringning är att svarande talar in sina svar. Det kan vara svårt för datorer att känna igen olika tal, svarande upplever det enklare och behöver inte någon speciell telefon. (Biemer & Lyberg 2003)
4.2.9 Direct observations
Antingen används utrustning t.ex. för mätning av luftföroreningar, tv tittande,
markobservationer, eller så använder observatören/ svarande sina egna sinnen för iakttagelse. Vid användandet av utrustning kan systematiska fel uppstå och program med kalibrering och validering bör användas. Felmarginalen som uppkommer för observatören/svarande liknas felmarginalen för svarande vid en intervju, svarande kan misstolka information eller med tid förändra sitt beteende. Denna metod används ofta i enkätundersökningar. (Biemer & Lyberg 2003)
4.3 Från nutid till framtid
Nu sker återigen ett tekniskt skifte liknande slutet av 1900-talet. Metoderna behöver anpassas efter nya tekniska möjligheter som skapat förändrade levnadsvanor. Nästa århundrande kommer insamlingsmetoderna bestå av mixed modes och självadministrerande frågeformulär där teknikerna behöver individanpassas. (Dillman 2007) Individanpassning är skillnad från tidigare då Särndal, Swensson & Wretman (1992) skriver att undersökningens population bör analyseras i sin helhet och såg inte individernas olika behov inom populationen.
Kunskapen har ökat om att metoder genererar olika resultat t.ex. telefonintervjuer ger mer positiva resultat om hälsofrågor än självadministrerande metoder, TDE ökar extremvärden m.m. (Dillman 2007).
4.3.1 Register-based statistics
Omfattas inte av survey metodikens teorier (Wallgren & Wallgren 2004). Data som samlas från befintliga register t.ex. Sveriges befolkningsregister är kostnadseffektivt, tillgängligt och håller ofta hög standard. Däremot är det inte säkert att all registerdata är kontrollerad av statistiker och korrekt insamlad och granskad, vilket bidrar till skiftande kvalité. Metoden har mindre risk för vissa typer av bias eftersom kontakt med svarande inte behövs. (Biemer & Lyberg 2003) Integrationsregister kan skapas av redan befintliga register. Registerstatistik har inga väletablerade teorier trots att det är en av de äldsta insamlingsformerna. Utvecklingen av metoden försvåras av att ämnet inte lärs ut inom statistik på universitet. (Wallgren & Wallgren 2004) För att statistikern ska få insikt i kvalitén, dataprocessen och innehållet i registerna bör nära kontakt med registeransvariga hållas (FN 2007).
4.3.2 Mixed modes
Analys av svarsbortfall i olika sociala sammanhang leder till att blanda metoder för att motverka metodernas enskilda svagheter. Mätfel kan uppkomma vid växlandet mellan metoder. Metoderna ska kombineras utifrån de svarande, utifrån kostnad och utifrån hur de påverkar varandra. Även tidsaspekter vid panelundersökningar och skillnader mellan populationer är faktorer att tänka på. (Dillman 2007)
Groves (2004) är av samma åsikt och anser att eftersom metoder har skillnader i täckning, bortfall, tidsram och kostnad så är det lämpligt att börja med den minst kostsamma och
fortsätta enligt den graderingen. DeLeeuw (2005) beskriver olika former av mixed modes som kan användas för vidare läsning, författaren tycker att denna metod har betydligt fler fördelar än nackdelar. ”We are likely to see even more creative use of mixed-mode designs in the future/.../” (Groves 2004, s. 165).
4.3.3 Tailored/ Adaptive design
Metoden förändras under datainsamlandet beroende på individerna i populationen. Framkom ur utvecklingen av webbaserade undersökningar för att minska högt bortfall och betydande mätfel. Adaptive design kan användas med en allokeringsmetod som bygger på pardata, hjälpinformation som observeras under datainsamlandet från populationerna. I artikeln beskrivs matematiska skattningsmetoder där den främsta faktorn är att arbeta
kostnadseffektivt. (Schouten, Calinescu & Luiten 2013)
4.3.4 Unimode construction
Dillman (2007) är ensam med benämningen av denna metod som innebär att vid intervjuer eller självadministrerande metoder ska den svarande få den stimuli den behöver vare sig det innebär text eller tal. Han menar att detta vore att se ett steg framåt jämfört med de metoder som idag används.
5 Slutsats och diskussion
Nu är min förhoppning att jag ökat din kunskap om insamlingsmetoders funktion och tankar runt metodval. Själv har jag ökat mina kunskaper om ämnet och förstår nu att många olika variabler spelar in för att få önskvärt slutresultat på en undersökning. För mer information om metoders funktion och samspel rekommenderar jag Biemer och Lyberg (2003) som skriver utförligast om nutidens metoder, författarna täcker in de variabler (i första hand tidsåtgång och ekonomi) som är viktiga vid metodval ur ett verkligt perspektiv.
I val av metod bör statistikern tänka på tidsperiod uppdragsgivaren anser möjlig och ekonomiska resurser, dessa variabler styr i dagens samhälle, men sedan bör beaktas vilket slutresultat som söks, hur populationen ser ut som ska undersökas och även om metoden behöver individanpassas. Nu när det blir allt vanligare med mixed modes sker en automatisk anpassning när individen kan välja mellan flera svarsmetoder. DeLeeuw, Hox och Dillman (2008) har många förslag på hur olika modeller av mixed modes skapas och lite nya synvinklar gällande bias. Det förvånade mig att vissa metoder (ex. TDE) genererade
positivare resultat och mer extremvärden än andra. Hur metoderna verkar gentemot varandra är viktiga kunskaper vid användandet av mixed modes.
Teknikens framsteg har varit drivkraft till de största förändringarna. Ny teknisk utveckling skapar självfallet nya möjligheter. Tänkvärt är att befolkningen förändrat beteende på grund av tekniska utvecklingen. I framtiden kommer t.ex. självadministrerande undersökningar användas mer pga att datoranvändande och tillgång till internet ökar men det är svårare att förutse efterföljande beteendeförändring, därför behöver insamlingsmetoder vara mer anpassningsbara än idag. I Dillman (2007) läses om framtidsaspekter och incitament som driver förändringar, koncentrationen ligger på självadministrerande undersökningar. Redan 2007 skrev Dillman att nästa skifte av förändring inträffat, jag anser att samma skifte pågår än och större förändring behövs. Avveckla enkätundersökningar och telefonintervjuer som utgör en stor del av dagens datainsamlande eftersom bortfallet ökar konstant. Satsa mer på
självadministrerande internetbaserade metoder. Dessa åsikter är grundade efter min utbildning, jag har inte arbetat än och kommer kanske till annan åsikt därefter.
Universiteten erbjuder ett brett urval av kurser på avancerad nivå inom surveymetodik intressanta för att besvara syftet med detta arbete. Kurserna Introduction to survey quality (se bil. 1) och Methods for official statistics (se bil. 2) ligger närmast ämnesområdet.
Universiteten har även varsin kurs inom registerbaserad statistik, Statistiska databaser och register (se bil. 3) och Registerbaserad statistik (se bil. 4). Däremot arbetar studenter som statistiker direkt efter grundutbildningen, utbildning på grundnivå borde innehålla information om nyare insamlingsmetoder och förutsättningar för metodval i arbetslivet. Argumentet är motiverat av utbildningsutbudet från min egen grundutbildning.
Wallgren och Wallgren (2007) skrev att brist på utbildning inom registerbaserad statistik hämmat utvecklandet av teorier, sedan 2010 har Stockholms universitet gett kurs (se bil. 3) i ämnet och Örebro universitet sedan 2014 (se bil. 4). FN (2007) har läsvärd ny teori om registerstatistik som ingår i utbildningsmaterialet. En önskan om framtiden vore att tekniska utvecklingen skulle leda mot ett sammanstrålat system av databaser för att lättare komma åt data, registerbaserad statistik skulle då kunna bli en framstående metod.
Källförteckning
Antagning.se https://www.antagning.se/se/start (Hämtad 2015-04-23, 14.17)
Biemer, P. & Lyberg, L. (2003). Introduction to survey quality. New Jersey, Hoboken: John Wiley & Sons, Inc. Dahmström, K. (2011). Från datainsamling till rapport: att göra en statistisk undersökning. 5. uppl. Lund: Studentlitteratur.
DeLeeuw, E. (2005). To Mix or Not to Mix Data Collection Modes in Surveys. Journal of Official Statistics, 21(2). ss. 233–255.
http://dspace.library.uu.nl/bitstream/handle/1874/202577/EdL-to%20mix%202005.pdf?sequence=1
DeLeeuw, E. (2010). Mixed-Mode Surveys and the Internet. Survey Practise, 3(6). www.surveypractice.org
DeLeeuw, E., Hox, J. & Dillman, D. (2008). International Handbook of Survey Methodology. Psychology Press. http://joophox.net/papers/SurveyHandbookCRC.pdf
Dillman, D. (2007). Mail and internet surveys: the tailored design method. 2. uppl. New Jersey, Hoboken: John Wiley & Sons, Inc.
Erikson, J., Haraldsen, G. & Snijkers, G. (2012). The future of statistical data collection? Challenges and opportunities. Seminar on New Frontiers for Statistical Data Collection. Geneva, Switzerland.
FN. (2007). Register based statistics in the Nordic Countries: Review of best practices with focus on population and social statistics. Geneva, Switzerland: United Nations.
Groves, R., Fowler Jr, F., Couper, M., Lepkowski, J., Singer, E. & Tourangeau, R. (2004). Survey methodology. New Jersey, Hoboken: John Wiley & Sons, Inc.
Schouten, B., Calinescu, M. & Luiten, A. (2013). Optimizing quality of response through adaptive survey designs, Component of Statistics Canada, Catalogue no. 12-001-X Business Survey Methods Division
Scb.se http://www.scb.se/sv_/Om-SCB/Sveriges-officiella-statistik/ (Hämtad 2015-09-10, 18.08)
Statistics.su.se http://www.statistics.su.se/ (Hämtad 2015-05-18, 10.20)
Särndal, C-E., Swensson, B. & Wretman, J. (1992). Model Assisted Survey Sampling. Springer-Verlag, New York.
Wallgren, A. & Wallgren, B. (2007). Register based Statstics: Administrative Data for Statistical Purposes. Chichester, John Wiley & Sons, Inc.
Bilaga 1
Syllabus
for course at first level
Introduction to Survey Quality Introduktion till surveykvalitet
7.5 Higher Education Credits
7.5 ECTS credits
Course code: ST305G
Valid from: Autumn 2014
Date of approval: 2007-05-23
Changed: 2014-03-12
Department Department of Statistics
Subject Statistics
Decision
This syllabus was approved by the Board of the Department of Statistics on March 23, 2007, and revised 2014-03-12.
Prerequisites and special admittance requirements
Statistical Theory, basic C-level, 5 points or Statistical Theory III, first level, 7,5 ECTS credits or equivalent.
Course structure
Examination code
11IE
Name
Introduction to survey quality
Higher Education Credits
7.5
Course content
The course consists of one course unit: 1. Introduction to survey quality
The course focuses on all the quality aspects common to both survey sampling and other surveys, i.e. cognitive aspects of survey measurements such as how to design questions and questionnaires, measures for avoiding survey nonresponse and how to deal with survey nonresponse.
The aim is that you shall be able to plan and conduct a survey with high data quality and afterwards be able to account for the quality in an appropriate way.
The concepts that are more thoroughly treated are:
Quality concepts. Mean squared error. Coverage problems. Survey nonresponse. The answering process. Question and questionnaire design. Choice of data collection method. Processing methods and evaluation surveys.
The content of the course gives extended knowledge of great use for planning and conducting different types of surveys, for example, social and behavioural research and official statistics and opinion and market surveys.
Learning outcomes
To pass the course the student should be able to:
- account for the most important features of planning surveys - account for the principal sources of errors occurring in surveys
- account for and apply some methods for prevention and measuring of errors in surveys - assess the quality of a survey
- use and be acquainted with literature on the field
Education
The teaching consist of lectures and exercises.
Forms of examination
a. Examination will be done by assessing the learning outcomes. Examination will be in the form of four written reports of compulsory exercises
b. Grading is done according to a seven-point scale related to the specified learning outcomes: A = Excellent
B = Very Good C = Good D = Satisfactory E = Adequate Fx = Inadequate F = Totally Inadequate
c. The assessment criteria for the course will be distributed at the beginning of the course. d. In order to pass the course, the grade E or higher is required on the course unit.
e. Students who have received the grade Fx or F on an examination are entitled to at least four additional examinations to achieve the lowest grade E as long as the course is given. Neither Fx or F are passed grades and both demands a re-examintion. Students who have received the grade E on an examination may not retake this examination in order to attempt
to achieve a higher grade.
Students who have received the grade Fx or F on an examination on two occasions by the same examiner have the right to request that a different examiner be appointed to set the grade of the examination. The request must be in writing and sent to the head of the department. The examination denotes all compulsory elements of the course.
Every time the course is given, there should be two examination opportunities during the current semester.
Interim
Students can request examination in accordance with this syllabus once per semester during a period of three semesters after the course is no longer given. The request must be in writing and sent to the head of the department.
Required reading
Bilaga 2
Preliminary Syllabus
for course at the advanced level
Methods for Official Statistics
Officiell statistikproduktion
7.5 Higher Education Credits
7.5 ECTS Credits
Course code: ST729AValid from: Spring 2012 Date of approval:
Department: Department of Statistics Main field: Statistics
Specialization: A1N-Second cycle, has only first-cycle courses as entry requirements
Decision
This syllabus is approved by the Board of the Department of Statistics at Stockholm University
Prerequisites and special admittance requirements course
Those for the Master’s programme in statistics, i.e., 180 higher education credits, 90 of them in statistics or equivalent subjects
Course structure
Examination code Name Higher education credits
11OS Methods for Official Statistics 7.5 Course content
The course consists of one phase 1. Production of Official Statistics
The course treats various aspects of methodological aspects of the production of official statistics. More specifically it will treat work conducted at the Swedish national statistical agency, Statistics Sweden. Topics include quality management systems, data collection modes, development and testing of questions and questionnaires, geographical
information systems, treatment of nonresponse, disclosure avoidance techniques as well as more detailed discussions about issues related to one business survey and one survey of individuals. Also some other aspects will be referenced in connection with the above.
The course will discuss matters on a more practical level than is usually the case in textbooks on survey methodology and statistics production.
Learning outcomes
After the course the student is expected to have gained such insights into the statistics production culture so that he or she
- is able to participate in a statistics production team - has the tools to propose improvement projects
- has the skills to handle a variety of methodological problems associated with specific production processes
- can assess risks of data disclosure and suggest measures to deal with those risks Teaching method
Teaching consists of lectures and exercises.
Examination
Examination is conducted by means of home assignments. Grading is done according to the seven grade scale A, B, C, D, E, Fx, and F. To pass the course at least grade E must be achieved.
Required reading
A course pack will be distributed at the first session.
Miscellanea
The course is a part of the Master’s program in Statistics and is mandatory for students participating in the Master’s program in survey methods and official statistics. The course is also offered as a stand-alone course.
Bilaga 3
Kursplan
för kurs på avancerad nivå
Statistiska databaser och register Statistical Data Bases and Registers
7.5 Högskolepoäng 7.5 ECTS credits
Kurskod: ST724A
Gäller från: HT 2010
Fastställd: 2010-02-24
Institution Statistiska institutionen
Huvudområde: Statistik
Fördjupning: A1N - Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav
Beslut
Denna kursplan är fastställd av styrelsen för Statistiska institutionen vid Stockholm universitet.
Förkunskapskrav och andra villkor för tillträde till kursen
90 högskolepoäng i statistik eller motsvarande, samt Engelska B eller motsvarande.
Kursens uppläggning
Provkod Benämning Högskolepoäng
11SE Statistiska databaser och register 7.5
Kursens innehåll
Kursen består av ett moment: 1. Statistiska databaser och register
Idag är databaser en integrerad del i statistikproduktion. Mycket statistik tas fram genom att sambearbeta uppgifter från olika källor. Uppgifterna måste då ha lagrats på ett sådant
sätt att sambearbetningen underlättas. Statistik redovisas också i form av databaser. Data kan t ex ha lagrats så att användaren kan konstruera sina egna tabeller eller studera helt egna frågeställningar.
Kursen tar bl a upp hur databaser och register byggs upp, användning av SQL, datamining, hjälpinformation, samkörning, samordning och kvalitetsaspekter på statistiska databaser. Mikrosimulering.
Kursens innehåll ger kunskaper som är av stor nytta vid framtagning av statistik som bygger på data från olika källor. Den som vill att insamlade uppgifter skall kunna användas i framtiden av andra har också stor nytta av kursen.
Förväntade studieresultat
Efter att ha genomgått kursen förväntas studenten
- känna till och redogöra för några vanliga svenska databaser och deras egenskaper samt kunna bedöma relevans och kvalitet hos olika ramar rent generellt
- känna till och redogöra för principerna för mikrosimulering och genomföra enklare mikrosimuleringar - använda några av våra vanligare program för databashantering såsom SQL
- behärska något enkelt program för datamining
hjälpinformationen i registren till effektiva skattningar.
Undervisning
Undervisningen består av främst av föreläsningar, övningar och laborationer. Ett obligatoriskt arbetsplatsbesök ingår.
Undervisningen kan komma att ges på engelska om behov föreligger.
Kunskapskontroll och examination
a. Kursen examineras genom kunskapskontroll av de förväntade studieresultaten.
Kunskapskontrollen sker genom dels inlämningsuppgifter, dels skriftligt och/eller muntligt prov.
b. Betygssättning sker enligt sjugradig målrelaterad betygsskala: A = Utmärkt B = Mycket bra C = Bra D = Tillfredsställande E = Tillräckligt Fx = Otillräckligt F = Helt Otillräckligt
c. Kursens betygskriterier delas ut vid kursstart.
d. För att få godkänt slutbetyg på hela kursen krävs lägst betyget E på momentet.
e. Studerande som fått betyget Fx eller F på ett prov har rätt att genomgå minst fyra ytterligare prov så länge kursen ges för att uppnå lägst betyget E.
Studerande som fått lägst betyget E på prov får inte genomgå förnyat prov för högre betyg. Studerande som fått betyget Fx eller F på prov två gånger av en examinator har rätt att begära att en annan examinator utses för att bestämma betyg på kursen. Framställan härom ska skriftligt göras till prefekten. Med prov jämställs också andra obligatoriska inslag.
Övergångsbestämmelser
Studerande kan begära att examination genomförs enligt denna kursplan även efter det att den upphört att gälla, dock högst tre gånger under en tvåårsperiod efter det att kursen upphört. Framställan härom skall skriftligt göras till prefekten. Med prov jämställs också andra obligatoriska inslag.
Begränsningar
Kursen kan inte ingå i samma examen som ST704A.
Övrigt
Kursen är obligatorisk i Masterprogram i Surveymetodik och Officiell statistik men kan också läsas som fristående kurs.
Kurslitteratur
Bilaga 4
Statistik, avancerad nivå, Registerbaserad statistik, 7,5
högskolepoäng
Statistics, Register Survey Methodology, Second Cycle, 7.5 Credits
Kurskod: ST4039 Utbildningsområde: Naturvetenskapliga
området
Huvudområde: Statistik Högskolepoäng: 7,5
Ämnesgrupp (SCB): Statistik
Utbildningsnivå: Avancerad nivå Fördjupning: A1N
Inrättad: 2013-12-05 Senast ändrad: 2014-09-26
Giltig fr.o.m.: Vårterminen 2015 Beslutad av: Prefekt
Mål
Mål för utbildning på avancerad nivå
Utbildning på avancerad nivå ska innebära fördjupning av kunskaper, färdigheter och förmågor i förhållande till utbildning på grundnivå och ska, utöver vad som gäller för utbildning på grundnivå, - ytterligare utveckla studenternas förmåga att självständigt integrera och använda kunskaper,
- utveckla studenternas förmåga att hantera komplexa företeelser, frågeställningar och situationer, och - utveckla studenternas förutsättningar för yrkesverksamhet som ställer stora krav på självständighet eller för forsknings- och utvecklingsarbete.
(1 kap. 9 § högskolelagen)
Kursens mål Kunskap och förståelse
Den studerande ska efter avslutad kurs ha
- kunskap om förutsättningar för officiell statistikproduktion avseende det europeiska statistiksystemet, datalagar, "code of practice" och kvalitet
- kunskap om statistik- och datahanteringssystem för produktion av officiell statistik - fördjupad kunskap om användning av administrativa data i produktion av officiell statistik - kunskap om metoder för mätning av "disclosure risk"
- kunskap om ansatser för att värdera osäkerhet i registerbaserad statistik. Färdighet och förmåga
Efter avslutad kurs ska den studerande kunna
- kombinera administrativa register för upprättande av statistikregister. Värderingsförmåga och förhållningssätt
Efter avslutad kurs har den studerande förmågan att
- självständigt bedöma möjligheten att använda administrativa data vid skapande av ny statistik - kritiskt värdera kvalitet i officiell statistik som är baserad på andra källor än undersökningar med sannolikhetsurval.
Kursens huvudsakliga innehåll
Kursen startar med en översikt över den officiella statistikproduktionens organisation i Sverige och dess koppling till det europeiska statistiksystemet. Begreppet "officiell statistik" samt relevanta lagar och
Handelshögskolan vid Örebro universitet
regler, ex.vis den svenska statistiklagen och Eurostats "code-of-practice", behandlas. I en fortsättning diskuteras administrativa data och möjlig användning av sådana vid officiell
statistikproduktion. En fördjupad behandling av metoder och tekniker för produktion av registerbaserad statistik behandlas där modeller för statistiksystem och datahantering diskuteras. Speciella problem som hanteras är länknings- och matchningsproblem, härledda variabler samt estimation.
Modeller för kvalitetsmätning av officiell statistik introduceras och kvalitetsskillnader mellan
urvalsbaserad resp. registerbaserad statistik diskuteras. Här lämnas speciellt utrymme åt statistikens tillförlitlighet och noggrannhet.
Kursen avslutas med en diskussion kring "disclosure risk" och metoder för värdering av sådan risk. Detta är speciellt aktuellt vid användning av administrativa data som ger möjlighet till statistik för små
domäner.
Studieformer
Undervisning ges i form av ett mindre antal föreläsningar och ett större antal workshops.
Föreläsningarna syftar till översikt över de områden och problem som behandlas varvid efterföljande workshops syftar till en studentdriven diskussion kring de specifika problem som behandlas i kursen. I kursen ingår en laboration med hantering av register samt författandet av en rapport innehållande en granskning av publicerad registerbaserad statistik. Båda dessa moment examineras muntligt och skriftligt.
Den som antagits till och registrerats på en kurs har rätt att erhålla undervisning och/eller handledning under den tid som angavs för kurstillfället som den sökande blivit antagen till (se universitetets
antagningsordning). Därefter upphör rätten till undervisning och/eller handledning.
Examinationsformer
Laboration, praktisk hantering av register, 2,5 högskolepoäng. (Provkod: 0100)
Skriftlig och muntlig redovisning
Rapport, Kvalitetsutvärdering, 1 högskolepoäng. (Provkod: 0200)
Skriftlig och muntlig redovisning
Tentamen, 4 högskolepoäng. (Provkod: 0300)
Individuell skriftlig tentamen
För ytterligare information se universitetets regler för examination inom utbildning på grundnivå och
avancerad nivå.
Betyg
Enligt 6 kap. 18 § högskoleförordningen ska betyg sättas på en genomgången kurs om inte universitetet föreskriver något annat. Universitetet får föreskriva vilket betygssystem som ska användas. Betyget ska beslutas av en av universitetet särskilt utsedd lärare (examinator).
Enligt föreskrifter om betygssystem för utbildning på grundnivå och avancerad nivå (rektors beslut 2010-10-19, dnr CF 12-540/2010) ska som betyg användas något av uttrycken underkänd, godkänd eller väl godkänd. Rektor eller den rektor bestämmer får besluta om undantag från denna bestämmelse för en viss kurs om det finns särskilda skäl.
Som betyg på kursen används Underkänd (U), Godkänd (G) eller Väl Godkänd (VG).
Laboration, praktisk hantering av register
Som betyg används Underkänd (U), Godkänd (G) eller Väl Godkänd (VG).
Rapport, Kvalitetsutvärdering
Som betyg används Underkänd (U) eller Godkänd (G).
Tentamen
Som betyg används Underkänd (U), Godkänd (G) eller Väl Godkänd (VG). För betyget G på kursen krävs betyget G på alla tre examinationsmomenten.
För betyget VG på kursen krävs betyget VG på tentamen, betyget VG på examinationsmomentet "Laboration, praktisk hantering av register, 2,5 hp" samt betyget G på "Rapport, Kvalitetsutvärdering, 1 hp".
avancerad nivå.
Särskild behörighet och andra villkor
Godkända resultat om minst 30 högskolepoäng inom statistik på A-nivå, som ska innehålla kursen Statistik A, Grundläggande statistik, 15 högskolepoäng, godkända resultat om minst 30 högskolepoäng inom statistik på B-nivå och godkända resultat om minst 15 högskolepoäng inom statistik på C-nivå. Dessutom krävs Engelska B/Engelska 6 från gymnasieskolan eller motsvarande.
För ytterligare information se universitetets antagningsordning.
Tillgodoräknande av tidigare utbildning
Student som tidigare genomgått utbildning eller fullgjort annan verksamhet ska enligt
högskoleförordningen tillgodoräknas detta som en del av den aktuella utbildningen under förutsättning att den tidigare utbildningen eller verksamheten uppfyller vissa krav.
För ytterligare information se universitetets lokala regler för tillgodoräknanden.
Kurslitteratur och övriga läromedel
Obligatorisk litteratur
European Statistics Code of Practice for the National and Community Statistical
Eurostat, 2011/Authorities (revised edition 2011)., ISBN/ISSN: 978-92-79-21679-4, Digital Object Identifier (DOI):10.2785/18474; Product code:KS-32-11-955 [Elektronisk resurs]
Wallgren A. and B. Wallgren (2014)
Register-based Statistics - Administrative Data for Statistical Purposes
Wiley, Chichester, 320 sidor
Tillägg och kommentarer till litteraturlistan
I kursen ingår även mellan 4-6 vetenskapliga artiklar, rapporter och stenciler. The course also includes between 4-6 scientific articles, reports and handouts.