Konsten att förutspå valresultat

(1)

Konsten att förutspå valresultat

Prognostisera resultatet av det svenska riksdagsvalet 2018 baserat på vallokalsundersökningsdata

Av Rasmus Sjövill

Statistiska Institutionen Uppsala Universitet

Handledare: Mattias Nordin

2019

(2)

Abstract

Exit polls have had a hard time predicting election results in Sweden over the last decade. The introduction of the Sweden Democrats in the political scene has generally caused problems for polling organizations. Opinion polls have a big influence on the economic market and therefore any wrongdoing might cause a big disturbance in the economy. This paper develops a model based on systematic sampling differences and sociodemographic background variables in order to predict the results of the Swedish general election 2018. The study uses data from SVT´s exit poll and SCB´s voter turnout survey. The results of the study show that the model in general predicts the 2018 Swedish general election better than the prognosis of SVT.

Keywords: VALU, Exit poll, Riksdagsvalet 2018, Valdata, Raking, Politisk prediktion, Vallokalsundersökning.

(3)

Innehållsförteckning

1. Introduktion ___________________________________________________________ 1

2. Tidigare Studier & Teori _________________________________________________ 2

3. Data __________________________________________________________________ 6 3.1 Deskriptiv Statistik ____________________________________________________________ 8

4. Metod _______________________________________________________________ 11 4.1 Metoddiskussion ____________________________________________________________ 11 4.2 Modell ____________________________________________________________________ 12 4.3 Modellutveckling ____________________________________________________________ 14

5. Resultat _____________________________________________________________ 17 5.1 Riksdagsvalet 2018 __________________________________________________________ 17 5.2 Känslighetsanalys ___________________________________________________________ 19

6. Diskussion ___________________________________________________________ 22 6.1 Framtida Modell ____________________________________________________________ 24 7. Slutsats______________________________________________________________ 24

Tack _____________________________________________________________________ 26

Referenser ________________________________________________________________ 27

Bilaga A __________________________________________________________________ 29

(4)

1

1. Introduktion

Träffsäkerheten hos samtliga opinionsinstitut för de mätningar som publicerades närmast valdagen vid 2018 års riksdagsval var klart sämre än de fyra tidigare riksdagsvalen. Medelfelet per parti var 1,6 procentenheter. Den ovanligt höga genomsnittliga avvikelsen är framförallt ett resultat av stor spridning mellan instituten och en svårighet av att skatta de största partierna i Sveriges riksdag. Exempelvis underskattades Socialdemokraterna och Moderaterna i samtliga mätningar. Samtidigt har det varit svårt att skatta Sverigedemokraterna sedan deras mediala och politiska genombrott.

Den största opinionsundersökningen vid svenska riksdagsval är SVT:s vallokalsundersökning (VALU) som publiceras på valnatten. VALU är en återkommande vallokalsundersökning vid riksdagsval som intervjuar individer direkt efter de har lagt sin röst för att få ett mer precist underlag över vad de faktiskt röstade på. I riksdagsvalet 2018 hade VALU en medelavvikelse på 0,97 mot valnattsresultatet. VALU har, likt andra opinionsmätningar, återkommande haft problem att uppskatta valresultatet för Sverigedemokraterna. Partiet har i tidigare val blivit kraftigt underskattade medan i riksdagsvalet 2018, i försök att kompensera för tidigare resultat, systematiskt blivit överskattade i relation till deras valresultat. Baserat på att valinstitut fortfarande har svårt att skatta vissa partier finns det utrymme för att göra prediktionen bättre.

Genom att utveckla en modell baserat på tidigare val och sociodemografiska bakgrundsvariabler avser denna uppsats att förutse valresultatet i det svenska riksdagsvalet 2018.

Arbetet är baserat på SVT:s vallokalsundersökning och SCB:s valdeltagarundersökning som tillhandahåller information om den röstberättigade befolkningen som väljer att delta i svenska riksdagsval. Uppsatsens huvudsakliga syfte är att förutspå valresultatet 2018. Genom att uppnå detta är förhoppningen att lösa det återkommande problemet gällande opinionsundersökningar, att bättre predicera så kallade missnöjespartier, vilket tidigare undersökningar tenderar att ha svårt att skatta. Resultatet visar att en modell som tar de systematiska skillnaderna i urvalet och tar hänsyn till information gällande ålder, kön och facktillhörighet bättre förutsäger valresultatet i jämförelse med SVT:s egna prognoser. Uppsatsen följer följande struktur: Först analyseras relevanta tidigare studier och metoder för viktning av sociala undersökningar. I nästkommande sektion, 3. Data, beskrivs den data som används vid studien och varför den valts ut för att utföra prognosen samt vilken relevant information som finns tillgänglig till vår analys. I sektion 4.

Metod presenteras den valda modellen vilket prognoserna baseras på och valet av

(5)

2

tillvägagångssätt diskuteras baserat på den data som används i studien. I efterföljande sektion, 5. Resultat, presenteras valprognosen som jämförs med SVT:s egen prognos. Vidare genomförs en känslighetsanalys där modellen appliceras på riksdagsvalet 2014, effekten av raking analyseras även i avsnittet. I 6. Diskussion analyseras resultatet, i vilket möjliga skäl till avvikelser i prognosen i förhållande till valresultatet och möjliga åtgärder för att undvika dessa avvikelser diskuteras. Till sist, i sektion 7. Slutsats, presenteras en modell för framtida prognoser samt rekommendationen för framtida studier.

2. Tidigare Studier & Teori

Analysering av undersökningsdata kan vara svårt, speciellt när det innefattar politiska preferenser. Det råder viss tabu gällande vad en röstar på vid val vilket ofta leder till snedfördelningar i urvalet. Det finns ofta skiljaktigheter i beskrivande karakteristiska drag mellan undersökningsurvalet och den allmänna populationen. Om dessa skillnader inte tas i beaktning för undersökningen kan resultaten vara missledande. Ett vanligt sätt att försöka eliminera problemet är att vikta de individuella undersökningssvaren. Observationen tillges vikter för att urvalet så bra som möjligt ska representera målpopulationen. Vikterna i sig är oftast utvecklade i ett antal steg för att kunna kompensera för ojämlikheter gällande urvalssannolikhet, icke-deltagande, icke-konvergens (när ett element i målpopulationen inte ingår undersökningens urvalsram) och fluktuationen från kända populationsvärden (Brick och Kalton, 1996), vilket i samlad mening kan beskrivas som bias, skillnaden mellan urvalet och populationen. Det flesta strategier vid viktningskorrigering för icke-deltagande involverar att dela upp respondenterna in i en uppsättning ömsesidigt uteslutande grupper, så kallade viktningsklasser. Sedan tilldelas en vikt för respektive grupp, eller till varje enskild medlem i grupperna.

Kalton och Flores-Cervantes (2003), Brick och Montaquila (2009) granskar olika vikningsmetoder, där storleken av bias undersöks. Brick och Jones (2008) undersöker bias för olika viktningsmetoder både analytiskt och genom simulation och diskuterar värdet av utomstående information. Generellt finns det ingen specifik metod som i högre utsträckning än andra är relaterad till minskning av bias. Metoder som begränsar möjligheter att ta tillvara på information om urvalet ger en högre bias (Brick, 2013). Detta betyder att val av metod ska tas i förhållande till data.

(6)

3

Det finns en rad olika metoder att använda sig utav vid viktning för att ta hänsyn till sociodemografiska bakgrundsvariabler, uppsatsen kommer i huvudsak fokusera på två metoder:

poststratifiering och raking.

Poststratifiering är en av de mest använda teknikerna inom viktning med mål att dela upp urvalet i grupper som bättre representerar populationen och på så sätt förbättra precisionen av valprognosen. Poststratifiering är i synnerhet dominerande när fullständig information om populationen finns att tillgå. Vid metoden används en uppsättning av variabler där populationsfördelningen är känd. Poststratifiering implementeras inom viktningsklasserna genom att korsa kategorier av bakgrundsvariablerna och konstruera vikter som reproducerar klasspecifika populationsskattningar. Poststratifiering kan appliceras med allt från en enda variabel, som åldersgrupp, till att inkludera all bakgrundsinformation. Det viktiga för att metoden ska vara applicerbar är att en känner till den samlade fördelningen för de valda variablerna. Till exempel, om vi viktar med avseende på kön, ålder och utbildning måste vi känna till storleken i förhållande till populationen för varje kombination av de valda variablerna.

Viktningen används för att kompensera för att personer med vissa karaktäristiska drag sannolikt i mindre utsträckning väljer att delta i undersökningen.

Fördelen med stratifiering är att den i sig blir detaljerad, då grupperna blir väldigt specifika.

Nackdelen är att det oftast finns en risk att stratifiering blir allt för detaljerad vilket leder till få observationer finns inom strata, vilket kan illustreras med exemplet ovan när vi viktar på endast tre variabler där kombinationen av grupper snabbt blir stor. Vid ytterligare tillägg av variabler blir risken av för små strata överhängande. Kravet att detaljerad information finns tillgänglig för populationen kan vara problematiskt, det fall där utomstående information är mindre detaljerad än där vi har fullständig information om alla individer kan beskrivas som ofullständig poststratifiering. Vi kan då använda oss av raking (Särndal, 1993).

Raking går ut på man tar en variabel åt gången och justerar vikterna så att det proportionellt representerar populationen för just den variabeln. Till exempel om kvinnor är överrepresenterade i urvalet i förhållande till populationen kommer männen få en vikt över 1 och kvinnorna än lägre än 1 för variabeln kön, allt annat lika. Proceduren fortsätter tills alla variabler har blivit viktade. Raking gör att skillnaden mellan urvalet och populationen minskar genom att vikterna justerar så att specifika karakteristika drag överensstämmer med populationen. Raking kan reducera för denna icke-deltagandebias, urvalsvariansen men även för icke-konvergensbias (Kalton, 1983). Icke-konvergensbias uppstår när ett element i

(7)

4

målpopulationen inte ingår i undersökningen urvalsram. Raking använder den marginella fördelningen för varje enskild variabel, vilket ej hade varit möjligt för poststratifiering då den kräver att vi känner till den gemensamma distributionen. Exempelvis kan poststratifiering vara mindre effektivt än raking när många variabler är tillgängliga tack vare att post-stratifiering är endimensionellt och bidrar till för små stratum (Brick, 2013).

De som ombeds att delta i en vallokalsundersökning kan välja att inte delta. Om denna grupp skiljer sig åt i sina politiska preferenser, mot de som faktiskt deltar, kan träffsäkerheten på undersökningen undermineras. En genomgående tro bland forskare är att vid ett större icke- deltagande del ökar skillnaden i karaktäristika mellan de som deltar och inte deltar vilket leder till bias (Alreck och Settle 1995; Babbie, 1990). Så länge icke-deltagande är slumpartat är det inga problem, eller att det ej är slumpartat men inte har något inflytande på resultatet av undersökningen. Vid undersökningar inom det politiska området har det visats att icke- deltagande inte är slumpartat och ger ett betydande utfall på undersökningen (Oleskog Tryggvason, 2014). Icke-deltagandet medför bias i estimaten vid analyser av undersökningen.

Bias kan reduceras, genom användning av utomstående information, den kan dock aldrig elimineras fullständigt (Särndal, 2011). Bias är den dominerande andelen av icke-svarande relaterade fel i estimaten. Icke-svarande bias minskar generellt inte när urvalet blir större vilket följer att biasen oftast är den största delen av medelstandardfelet även för subgrupper i urvalet, vilket tyder på att biasen är systematisk för hela urvalet (Brick, 2013). Justering för icke- svarande kan antingen graderas som lätt eller betydande, beroende på vad vi vet om de som valt att inte delta (Kalton och Maligalig, 1991).

Vanligtvis inom undersökningar som handlar om befolkningen finns det en stor mängd information tillgänglig om de svarande men vi vet oftast lite om de som inte valt att delta.

Viktning av enkätmaterial som undersöker röstning och annat politiskt beteende är allt som oftast problematiskt. Ett dilemma som kan uppstå är svårigheten att korrekt identifiera de grupper som man försöker att vikta mot. Statistik över sociodemografiska variabler finns tillgänglig i Sverige. Vi vet till exempel hur många röstberättigade det är i Sverige, hur många män respektive kvinnor det bor i landet, ålder och så vidare. Problemet är att dessa variabler är baserat på hela befolkningen och inte de facto de som röstar. Det uppstår därför ett problem ifall de som röstar skiljer sig åt gentemot populationen (Oleskog Tryggvason, 2014). När en predicerar valresultat bör därför denna osäkerhet tas i beaktning när man väljer i vilken utsträckning en ska vikta enkätsvar efter populationsestimaten då viktningen bör avspegla de som röstar och inte ett lands röstberättigade befolkning. Opinionsinstituteten brukar använda

(8)

5

röstning i föregående riksdagsval för viktning. Problemet här är att studier visar att 25 % anger att de röstar på ett annat parti än vad de gjorde strax efter föregående val, vilket medför stora reliabilitetsproblem. Problemet uppstår då väljarna minns fel när det kommer till vilket parti de röstade på i föregående val samt även i viss mån inte vill kännas vid att de gjort ett skifte i politisk inriktning, de vill säga svarar osanningsenligt (Oleskog Tryggvason, 2014).

Vikter är inte enbart skapade baserat på sannolikheten för urvalsselektionen utan snarare en kombination av sannolikhetsberäkningar och justeringar för icke-deltagare. Generellt finns det skillnader i deltagande beroende på vart individer placeras in på en höger-vänster-skala, där högerväljare oftast är underrepresenterade vid opinionsmätningar i vilket prognosen måste justeras för icke-deltagandet av högerväljare i urvalet. Om det inte existerar någon information om icke-deltagande kan vikter skapas baserat på denna sannolikhet samt information känd för både urvalet och populationen i sin helhet där vikterna är tilldelade i proportion av andelen i populationen som är täckta i urvalet. Viktning av denna korrigerar för icke-deltagande samtidigt som det implementerar ett element av poststratifiering (Holt and Smith, 1979). Detta måste dock göras i försiktighet då observerade skillnader mellan urvalet för undersökningen och populationen kan exempelvis bero på olikheter i hur undersökningar gjorts och hur frågorna är formulerade (Peter Lynn, 1996).

Peytcheva och Groves (2009) undersöker 23 studier med icke-deltagande bias för att se om svarsdeltagande bland demografiska grupper är informativt för att eliminera biasen. De kommer fram till att andelen inte svarande i sig är ett dåligt estimat för att mäta själva biasen, vilket är i enlighet med Groves (2006). Tidigare studier visar på att det generellt är lägre svarsfrekvens bland de mindre välutbildade (tex. Farrant and O’Muircheartaigh, 1991), vilket kan ses som en ganska konstant avvikelse. Lägre svarsfrekvens är ofta också associerad med urbana områden, lägre sociala klasser och män (McDaniel et al, 1987, Barnes, 1992). Svenska väljare och svenska allmänna val är långt ifrån något genomsnitt. Väljarbeteende och val i Sverige är i många avseenden unikt och klart avvikande från vad vi ser i andra demokratier. Svenska val kännetecknas av högt valdeltagande, exceptionellt hög klassröstning och hög endimensionell vänster-högerröstning (Oscarsson och Holmberg, 2016). Kopplingen mellan socioekonomiska grupptillhörigheter och val av parti är svagare idag än för 50 år sedan. Dock visar tendenser att köns- och åldersskillnaden ökar i röstandet. Religionsskiljelinjer har aldrig varit starka i Sverige.

Skiljelinjer mellan stad och landsbygd är lika stora idag som för 15 år sedan (Oscarsson och Holmberg, 2016).

(9)

6

Tillgången till värdefull utomstående information varierar beroende på land och vilken typ av undersökning som genomförts. När icke-svarande har stor biaseffekt på undersökningens estimat är tillgängligheten till information allt mer viktigt, genom att markant kunna reducera bias. De skandinaviska länderna har en stor fördel i de avseendet då högkvalitativa data ofta finns att tillgå. Vilken data en väljer att använda har betydelse för metoden och således resultatet av studien.

3. Data

För att kunna predicera valresultatet kommer SVT:s Vallokalsundersökning att användas. En vallokalsundersökning är en opinionsundersökning som görs bland väljare som nyss avgivit sin röst. VALU, SVT:s vallokalsundersökning har gjorts sedan 1991 och presenteras på valkvällen efter att vallokalerna har stängt för att ta bort influensen på röstbeteende. VALU är den mest betydelsefulla opinionsundersökningen i Sverige där mellan 10 000 och 15 000 väljare anonymt får besvara en enkät med 40 frågor, bland annat om vilket parti man röstat på, vilka sakfrågor som är viktigast för en och bakgrundinformation så som ålder och kön. Eftersom undersökningen har genomförts sedan 1991 är det möjligt att studera hur väljarnas preferenser och beteende har förändrats över lång tid. VALU genomförs över hela landet och var vid det senaste riksdagsvalet 2018 uppdelat i fyra regioner (nord, syd, öst, väst). Intervjuerna görs både under förhandsröstningen och på själva valdagen. VALU 2018 bygger på enkätsvar från 11 808 väljare vid 100 vallokaler och 50 förtidsröstningslokaler under perioden 3 - 9 september 2018.

Vallokalerna var fördelade på de olika regionerna i enlighet med regionernas storlek vad avser antalet röstberättigade. Inom varje region valdes de genom ett slumpmässigt stratifierat urval de valdistrikt som skulle ingå. Förtidsröster motsvarar 32 % av urvalet med resterande del av urvalet insamlat på valdagen (VALU 2018, 2018).

För att möjliggöra viktning krävs det att informationen för de inkluderade variablerna inte bara finns att tillgå för urvalet utan även för målpopulationen. Ett vanligt tillvägagångssätt är att använda information över den vuxna befolkningen eller den röstberättigade delen. Detta kan leda till bias då den faktiska målpopulationen vi söker är det som faktiskt väljer att rösta. Därför kommer denna studie att använda sig utav SCB:s valdeltagandeundersökning (SCB, 2019).

Syftet med undersökningen är att producera utförlig statistik över valdeltagandet vid allmänna val. Valdeltagandeundersökningen presenterar information om valdeltagandet i olika grupper i samhället. Information om de röstande finns för allt mellan en endimensionell till en tredimensionell skala (exempel tredimensionell: Ålder, kön, utbildningsnivå för stratum i

(10)

7

populationen). Rent allmänt är syftet med valdeltagandeundersökningen at allsidigt redovisa och ge en samlad bild av de allmänna valen i Sverige. Underlaget till Statistiken inhämtas genom länsstyrelserna till vilket SCB sänder underlag i form av listor på urvalspersoner (SCB, 2019). Länsstyrelserna går igenom röstlängderna och markerar om personen röstat eller ej vid de olika valen. Eftersom uppgifterna hämtas från röstlängderna finns det inte någon osäkerhet kring huruvida personerna i urvalet deltagit i valet eller inte, det vill säga ingen icke-svarande bias. Det finns dock en viss osäkerhet i beräkningarna, eftersom undersökningen baseras på ett urval av de röstberättigade (SCB, 2019). Valdeltagandeundersökningen genomförs efter valen, vilket betyder att endast information från föregående val innan 2018 finns tillgängligt för studien.

Att använda 2014 års data för att vikta 2018 års val kan i sig inte anses vara helt oproblematiskt.

En möjlighet är att predicera förändringar i den använda information, vilket i sig kunde ge en mer rättvis fördelning men skulle samtidigt skapa en osäkerhet. Förändringar i den använda data mellan åren är inte omfattande och således tas beslutet att göra en naiv prediktion baserat på uppgifter för valdeltagare under föregående val, 2014. Värt att poängtera är att det finns en uppsjö av information om de valdeltagande i valdeltagarundersökningen men att det inte mätts på samma sätt i VALU eller inte finns tillgängligt där. En analys för att sortera ut information måste därför göras i försiktighet då observerade skillnader mellan urvalet för undersökningen och populationen exempelvis kan bero på olikheter i hur undersökningar genomförts, hur frågorna är formulerade (Peter Lynn, 1996), vilken data som finns tillgänglig är den faktor som starkast bidrar till hur vi väljer att gå tillväga när vi försöker att prognostisera riksdagsvalet 2018.

(11)

8

3.1 Deskriptiv Statistik

Efter att frågeställningarna analyserats och variablerna som är tillgängliga sållats ut har tillslut tre variabler inkluderats i modellen. Anledningen till att de valts kommer att diskuteras i nästkommande sektion, 4. Metod. För att ge ytterligare kunskap om de variabler som studien grundar sig på presenteras förtydligande statistik nedan. Statistiken som redovisas är för 2018 informationen som används för 2018 års prognos, det vill säga vallokalsundersökningen 2018 och valdeltagarundersökningen 2014. Förenklat kan vi säga att om skillnaden mellan den observerade marginaldistributionen i populationen, det vill säga valdeltagare, och urvalet är stor ju större effekt kommer viktningen att ha.

Figur 1: Andelen kvinnor respektive män bland svarande i VALU 2018 respektive valdeltagare 2014. Mätt i procent, trunkerad.

Figur 1 redovisar andelen kvinnor respektive män i urvalet vs populationen. Valdeltagandet bland kvinnor är i genomsnitt högre än för män. Kvinnor har också större benägenhet att delta i vallokalsundersökningen. Av grafen kan vi utläsa att kvinnor är överrepresenterade i urvalet i förhållande till populationen, vilket kommer bidra till att kvinnor kommer att ha en lägre vikt än män givet att allt annat hålls konstant.

(12)

9

Figur 2: Ålder uppdelat i 13 årsgrupper bland svarande i VALU 2018 respektive valdeltagare 2014. Mätt i procent.

Åldersskillnaden mellan urvalet och populationen redovisas i figur 2. De yngsta röstande, 18–

24 år och det äldsta 65+ år är underrepresenterade medan åldrarna 25–64 är överrepresenterade i urvalet i förhållande till valdeltagarna. Störst skillnad mellan deltagande i VALU och valdeltagande är det för personer över 80 år som endast motsvarar för knappt 2 % i urvalet mot 6 % i populationen.

(13)

10

Figur 3: Andelen i respektive fackförening bland svarande i VALU 2018 vs valdeltagare 2014.

Mätt i procent.

SACO är knappt överrepresenterade i urvalet medan LO- och TCO-medlemmar utgör strax över 50 % i populationen men endast 35 % i urvalet (figur 3). De som inte har fackföreningsmedlemskap är kraftigt överrepresenterade i urvalet i förhållande till populationen.

(14)

11

4. Metod

4.1 Metoddiskussion

För att så bra som möjligt förutspå resultatet vid 2018 års riksdagsval krävs det en väl utbyggd empirisk modell. Genom att utveckla modellen baserat på föregående val hoppas slutsatser kunna dras från dessa för framställningen av en god modell för riksdagsvalet 2018. Modellen kommer att utvecklas baserat på de två i tiden tidigare riksdagsvalen, 2010 och 2014. Svenska väljarkåren är ständigt i förändring vilket kan leda till att om vi utvecklar vår modell baserat på val långt bak i tiden kan den bli missvisande. Det svenska valklimatet har förändrats sedan intåget av Sverigedemokraterna i det politiska finrummet. Samtliga riksdagspartier återfinns i riksdagen även vid 2010 års val varför det anses vara till fördel för utvecklingen av modellen.

Utvecklingstrenderna inom samhällsvetenskaperna visar att politiska partiers tidigare stabila sociala väljarbas sakta håller på att urholkas. Sambandet mellan socioekonomiska grupptillhörigheter och partival är betydligt svagare idag än tidigare. Relationen mellan klass och partival, mellan yrke och partival har minskat mest. Variationer i röstning mellan olika geografiska områden speglar i huvudsak skillnader i befolkningssammanställning, vilket kan kopplas till variationer i arbetsmarknad och näringsstruktur. Ålder, kön och sektorstillhörighet uppvisar sociala stratifieringar som utvisar ett stabilt eller ökande samband med partivalet över tid (Oscarsson och Holmberg, 2013). Det finns med andra ord större skäl att ta hänsyn till kön och ålder i analyser i jämförelse med klasskillnader. När det gäller facktillhörighet är det i huvudsak ett oförändrat samband med partival över tid. Vid riksdagsvalet 2010 visar valundersökningen på ett starkare samband mellan utbildningsnivå och partival, där ålder, kön och partival uppvisade det starkaste sambandet hittills (Oscarsson och Holmberg, 2013).

Valet av variabler att basera viktningen på bör rimligen utgå från följande: Variabler som har en signifikant effekt på urvalet och icke-deltagande men även också potentiellt kan förutspå valresultatet bör inkluderas i modellen.

Baserat på detta samt utvecklingstrenderna och de data som finns tillgänglig i både vallokalsundersökningen och valdeltagarundersökningen kommer studien ha som utgångspunkt att använda sig av ålder, kön och utbildning vid analyseringen av partivalsdata.

Värt att påpeka är att utbildning inte fanns tillgänglig för 2010 och 2014 års val och kunde således inte tas med. Viktningsmetod bör väljas i förhållande till den information som att tillgå av målpopulationen, det vill säga metoden som väljs bör vara den som bäst kan utnyttja de valda

(15)

12

data. För att fånga upp så många grupper som möjligt baserat på det som samhällsvetenskapen beskriver som samband mellan population och partival kommer raking att användas för att konstruera vikter baserat på karaktäristika drag. Om poststratifiering valts hade modellen enbart tillåtit oss att använda en trevariabelmodell baserad på 4 åldersgrupper då valdeltagandeundersökningen endast redovisar den samlade fördelningen för tex. kön, ålder och utbildning uppdelat på 4 åldersgrupper. Om vi istället använder raking har vi tillgång till 13 åldersgrupper samt även möjlighet att inkludera fler variabler för viktningen, vilket ses som en klar fördel då just ålder beskrivs som en av de variabler som har starkast samband med partival.

Raking får anses vara mer effektivt då det i detta fall tar tillvara på de tillgängliga data bättre än poststratifiering (Brick, 2013).

4.2 Modell

För att ge en grundläggande beskrivning av modellen kommer algoritmen för prognosen att beskrivas nedan. På en simpel nivå består raking algoritmen av en yttre process som behandlar konvergenskriteriet och en inre process som itererar med avseende på kontrollvariablerna, i vår modell: ålder, kön och facktillhörighet. 𝑤_𝑗^𝑘,𝑣, är vikten för observation j beräknat i den yttre processen k efter stratifiering med hänsyn på den v:te variabeln. K går från 1 till ett förbestämt antal iterationer k och v går från 0, input vikten av en given iteration, till den första, justeringen med hänsyn till den första kontrollvariabeln, till den andre, justering med hänsyn till den andre kontrollvariabeln, till den tredje, justering med hänsyn till den sista kontroll variabeln.

Ordningen, i vilken följd variablerna justeras, har ingen påverkan på resultatet av metoden.

1. Processen börjar med att k ← 0 och vikterna 𝑤_𝑗^0,3← 𝑤_1𝑗 , dvs basvikterna används för att initialisera rakingvikten.

2. Använd estimatet från den föregående yttre processen iterationen för att initialisera vikten på den nuvarande yttre processen iterationen. k ← k + 1, och uppdaterade vikten 𝑤_𝑗^𝑘,0← 𝑤_𝑗^𝑘−1,3

3. Den inre processen: gå igenom kontrollvariablerna v =1,2,3, och uppdatera vikterna.

(1) 𝑤_𝑗^𝑘,𝑣 = { 𝑤_𝑗^{𝑘,𝑣−𝑙}, ^𝑇[𝑋^𝑣^]

∑_𝑙∈S𝑤_𝑙^{𝑘,𝑣−𝑙}𝑥_𝑣𝑙 , 𝑥_𝑣𝑗 ≠ 0 𝑤_𝑗^{𝑘,𝑣−𝑙} , 𝑥_𝑣𝑗 = 0

(16)

13

4, Processen upprepas tills det viktade urvalet, ∑_𝑙∈S𝑤_𝑙^{𝑘,𝑣−𝑙}𝑥_𝑣𝑙, och målpopulationens totalantal, 𝑇[𝑋_𝑣] , med hänsyn till alla v =1,2,3 konvergerar, vilket till slut skapar rakingvikten, 𝑤_𝑗, för individ j.

(2) 𝑉𝑎𝑙𝑝𝑟𝑜𝑔𝑛𝑜𝑠_𝑖 = 𝑉𝐴𝐿𝑈𝑟å𝑑𝑎𝑡𝑎_𝑖 × 𝑃𝑎𝑟𝑡𝑖𝑣𝑖𝑘𝑡_𝑖× ∑ ^𝑤^𝑗𝑖

𝑛 𝑛𝑗=1

Medelvärdet av alla rakingvikter för individer som röstar på parti i multipliceras senare med aktuell partivikt, i, vilket är den systematiska avvikelsen mellan rakingprognosen och valresultatet baserat på tidigare riksdagsval, och VALU-rådata för parti i vilket ger valprognosen för parti i.

I nästkommande delsektion, 4.3 Modellutveckling, beskrivs de steg som tagits för att utveckla modellen för riksdagsvalet 2018 mer detaljerat.

(17)

14

4.3 Modellutveckling

TABELL 1: INFORMATION FÖR PROGNOSEN AV VALET 2010

201 0

PARTI VALU- RÅDAT A

RAKINGPROGNOS(%

)

VALRESULTAT(%

)

AVVIKELS E

AVVIKELSEVIK T

M¹ 28,4 25,28 30,06 4,78 1,19

C² 7,1 6,45 6,56 0,11 1,02

L³ 7,9 7,87 7,06 0,81 0,90

KD⁴ 5,4 5,24 5,60 0,36 1,07

S⁵ 27,8 32,83 30,66 2,17 0,93

V⁶ 7,5 7,60 5,60 2,00 0,74

MP⁷ 10,2 9,42 7,34 2,08 0,78

SD⁸ 4 3,87 5,70 1,83 1,47

Övrig a

1,7 1,45 1,42 0,03 0,98

Efter att ha analyserat de karaktäristiska variablerna som fanns tillgängliga för viktning valdes till slut i enlighet med teorin, ålder, kön och facktillhörighet ut. Dessa gav en så stabil avvikelse mellan valen 2010 och 2014 som möjligt. I tabell 1 presenteras statistik för riksdagsvalet 2010.

För varje enskilt parti redovisas VALU-rådata, rakingprognosen, valresultatet, avvikelsen mellan valresultat och rakingprognosen samt en avvikelsevikt vilket är valresultatet dividerat med rakingprognosen. Rakingen är baserat på data om målpopulationen från valdeltagandeundersökningen 2006. Rakingprognosen baseras enbart på raking och har som syfte att utveckla avvikelsevikten som i sin tur används för att förklara de systematiska skillnaderna mellan VALU-rådata och valresultaten. Antagandet att deltagarna i VALU är demografiskt och åsiktsmässigt representativa för de partier de röstat på är inte en

1 Moderaterna

2 Centerpartiet

3 Liberalerna

4 Kristdemokraterna

5 Socialdemokraterna

6 Vänsterpartiet

7 Miljöpartiet

8 Sverigedemokraterna

(18)

15

oproblematisk utgångspunkt, där det tvärtom snarare är sannolikt att de som ställer upp och svarar på VALU skiljer sig från de som inte vill ställa upp, både när det kommer till politiska åsikter och sociodemografisk komposition. Det har systematiskt visat sig att högerpartier i huvuddrag blir underskattade vid vallokalsundersökningar i Sverige medan partier på den vänstra sidan av det politiska spektrumet oftast är överskattade (Oscarsson och Holmberg, 2013). Avvikelsevikt fångar upp rösthistoriken och den historiska avvikelsen mellan opinionsundersökningen och valresultatet. Tabellen visar på just detta samband där de partier mot vänster har en avvikelsevikt under 1,0 vilket säger att de överskattas av modellen medan högerpartierna med ett värde över 1,0 i stor grad har underskattats. Sverigedemokraterna är det parti som sämst prediceras, vilket är i enlighet med tidigare studier där det visat sig att missnöjespartier ofta underskattas. Skälet till detta kan vara flera, vilket i sig är intressant men är ej av relevans i denna studie.

TABELL 2: INFORMATION FÖR PROGNOSEN AV VALET 2014

201 4

PART VALU- RÅDAT A

RAKINGPROGNOS(%

)

VALRESULTAT(%

)

AVVIKELS E

AVVIKELSEVIK T

M 21,8 20,07 23,33 3,26 1,16

C 6,4 6,14 6,11 0,03 1,00

L 6,4 6,39 5,42 0,97 0,85

KD 5,0 4,61 4,57 0,04 0,99

S 28,7 31,98 31,01 0,97 0,97

V 8,1 8,27 5,72 2,55 0,69

MP 8,8 8,26 6,89 1,37 0,83

SD 8,0 7,79 12,86 5,07 1,65

Övrig a

6,8 6,50 4,09 2,41 0,63

I tabell 2 presenteras liknande estimat för riksdagsvalet 2014. Rakingen är baserat på data om målpopulationen från valdeltagandeundersökningen 2010. Trenderna är detsamma som vid riksdagsvalet 2010, även här överskattas vänsterpartierna medan högerpartierna underskattas.

(19)

16

Den enda avvikande trenden finns bland övriga partier, vilket kan förklaras med att Feministiskt initiativ till största del representerar denna grupp (3,12 %) som är ett vänsterparti. Det antyder att det finns en systematisk skillnad där ytterkantspartierna avviker mest från medel.

TABELL 3: AVVIKELSEVIKT FÖR VALET 2010 OCH 2014 SAMT PARTIVIKT

Parti M C L KD S V MP SD Övriga

Avvikelsevikt 2010

1,19 1,02 0,90 1,07 0,93 0,74 0,78 1,47 0,98

Avvikelsevikt 2014

1,16 1,00 0,85 0,99 0,97 0,69 0,83 1,66 0,63

Partivikt 1,18 1,01 0,87 1,03 0,95 0,71 0,81 1,56 0,80

I tabell 3 presenteras avvikelsevikterna för samtliga partier samt en partivikt som räknas ut genom att ta medelvärdet av de två föregåendevalens avvikelsevikter. Tack vare att trenderna håller i sig gällande avvikelse för partierna i det två tidigare valen får ett medelvärde av dessa anses vara en god representant för att förklara den systematiska skillnaden mellan vallokalsundersökningsurvalet och valresultatet. Den enskilda vikten för varje parti kommer därför att tilläggas till varje individ som röstar på ett visst parti utöver den individuella vikten från raking vid prognosen av riksdagsvalet 2018. Detta för att förklara de systematiska skillnaderna i urvalet och således ge en så god prediktion som möjligt. Slutligen multipliceras partivikten med medelvärdet för vikten som skapas av raking för varje person som röstat på ett givet parti som i sin tur multipliceras med VALU rådata. Detta ger valprognosen för det aktuella partiet.

(20)

17

5. Resultat

5.1 Riksdagsvalet 2018

TABELL 4: VALPROGNOS OCH TILLHÖRANDE STATISTIK FÖR VALET 2018 20

18

PARTI VAL U- RÅD ATA

RAKING - PROGN

OS(%)

PARTI VIKT

VALPROG NOS(%)

VALRESUL TAT(%)

AVVIK ELSE

SVT/V ALU:S PROGN OS

VALU- AVVIK ELSE

M 17,6 16,21 1,18 19,13 19,84 0,71 17,8 2,04

C 10 9,76 1,01 9,85 8,61 1,24 9 0,39

L 6,7 6,68 0,87 5,81 5,49 0,32 5,5 0,01

KD 6,6 6,40 1,03 6,60 6,32 0,28 7,4 1,08

S 28,6 31,74 0,95 30,15 28,26 1,89 26,2 2,06

V 11,2 11,50 0,71 8,17 8,00 0,17 9 1

MP 6,3 6,40 0,81 5,18 4,41 0,77 4,2 0,21

SD 10,9 9,58 1,56 14,94 17,53 2,59 19,2 1,67

Övriga 1,9 1,74 0,80 1,39 1,53 0,14 1,8 0,27

Medelav vikelse

0,90 0,97

I tabell 4 presenteras resultatet av studien tillsammans med statistik för riksdagsvalet 2018. För varje enskilt parti redovisas VALU rådata, rakingprognosen, partivikten, valprognosen, valresultatet, avvikelsen mellan valresultat, valprognosen, SVT/VALU:s prognos samt medelavvikelsen från valresultatet för både valprognosen och SVT/VALU:s prognos.

Valprognosen uppskattar valresultatet för Moderaterna, Kristdemokraterna, Vänsterpartiet, Socialdemokraterna samt övriga partier med högre precision än SVT/VALU:s prognos medan den förutsäger resterande partier sämre. Överlag har valprognosen en medelavvikelse på 0,90 vilket är mindre än SVT/VALU:s prognos som har en medelavvikelse på 0,97. Om vi jämför med samtliga opinionsinstitut som tillsammans hade ett medelfel per parti på 1,6 procentenheter (Oleskog Tryggvason, 2018). Valprognosen är överlag god för samtliga partier förutom Socialdemokraterna och Sverigedemokraterna. Valprognosen för Socialdemokraterna är 1,89 procentenheter högre än valresultatet, att S avviker mer än genomsnittet är naturligt tack vare att de är största parti och således bör variationen i deras prognos vara störst men det i sig kan ej förklara hela avvikelsen. Valprognosen för Sverigedemokraterna är den som avviker mest mot

(21)

18

valresultatet med hela 2,59 procentenheter. Vänsterpartiet tätt följt av Kristdemokraterna och Liberalerna är de enskilda partier som valprognosen ger närmast prognos för mot valresultatet.

Prognosen för Moderaterna och Miljöpartiet avviker från resultatet med under 1 procentenhet.

Övriga partiers underskattades efter appliceringen av partivikt, vilket har mycket att göra med att Feministiskt initiativ (FI) hade stor påverkan på partivikten för övriga partier då den baserades på de två tidigare valen där FI var överlägset största parti bland icke-riksdagspartier.

Vid 2018 valår representerade de 0,46 procentenheter av väljarstödet bland övriga partier i jämförelse med 2014 där de svarade för 3,13 procentenheter. När vi analyserar partivikterna kan vi se att alla vikterna går åt rätt håll, det vill säga justerar rakingprognosen mot valresultatet, för samtliga partier förutom Centerpartiet och Kristdemokraterna. Sammantaget har inkluderingen av partivikt haft en positiv effekt på prognostiseringen av valresultatet.

(22)

19

5.2 Känslighetsanalys

När en predikterar resultat finns det alltid ett element av chans. Att modellen prognostiserar valresultatet 2018 bättre än SVT:s prognos kan vara just på grund av den välkända slumpen.

För att kunna utvärdera om modellen faktiskt är bättre att prognostisera valresultatet än SVT:s egen prognos appliceras modellen på riksdagsvalet 2014.

TABELL 5: VALPROGNOS OCH TILLHÖRANDE STATISTIK FÖR VALET 2014 20

14

PARTI VAL U- RÅD ATA

RAKINGPRO GNOS(%)

PARTI VIKT

VALPROG NOS(%)

VALRESUL TAT(%)

AVVIK ELSE

VALU- PROGN OS(%)

VALU- AVVIK ELSE

M 21,8 20,07 1,20 24,07 23,33 0,74 22,2 1,13

C 6,4 6,14 1,00 6,12 6,11 0,01 6,5 0,39

L 6,4 6,39 0,92 5,85 5,42 0,43 6 0,58

KD 5 4,61 1,06 4,90 4,57 0,33 5 0,43

S 28,7 31,98 0,93 29,88 31,01 1,13 31,1 0,09

V 8,1 8,27 0,74 6,15 5,72 0,43 6,6 0,88

MP 8,8 8,26 0,82 6,80 6,89 0,09 7,1 0,21

SD 8 7,79 1,56 12,15 12,86 0,71 10,5 2,36

Övriga 6,8 6,50 0,97 6,29 4,09 2,20 5 0,91

Medelav vikelse

0,67 0,73

I tabell 5 redovisas, för varje parti, VALU-rådata, rakingprognosen, partivikten, valprognosen, valresultatet, avvikelsen mellan valresultat, valprognosen, SVT/VALU:s prognos samt medelavvikelsen från valresultatet för både valprognosen och SVT/VALU:s prognos.

Konstruktionen av partivikterna är baserad på medelavvikelsen mellan rakingprognosen och valresultatet för 2010 och 2014 års riksdagsval. Rakingprognosen i sig är således baserat på data från 2006 och 2010 års valdeltagandeundersökning.

Av resultatet i tabell 5 kan vi utläsa att modellen överlag skattar samtliga riksdagspartier väl.

Socialdemokraterna är fortfarande det riksdagsparti vars prognos avviker mest från valresultatet med en avvikelse på 1,13 procentenheter. Prognosens största avvikelse hittar vi bland övriga partier för vilka valprognosen överskattar deras resultat med 2,20 procentenheter. Denna

(23)

20

överskattning har en naturlig förklaring då Feministiskt initiativ representerar en överväldigande del av denna grupp (3,12 %). FI är ett vänsterparti vars väljare tenderar att systematiskt vara överrepresenterade i VALU vilket bidragit till att övriga partier överskattats.

Om prognosen hade gjorts med avsikt att så väl som möjligt prognostisera valet 2014 hade FI tack vare sin storlek fått en enskild prognos och således en egen partivikt. Syftet med valprognosen 2014 är att istället jämföra modellen uppbyggd på samma sätt som för riksdagsvalet 2018. I och med att FI var förhållandevis liten i de föregående riksdagsval som viktningen bygger på ger det inte samma utslag i partiviktnigen som de annars borde ha.

Valprognosen för samtliga partier ger totalt en medelavvikelse på 0,67 procentenheter vilket är sammantaget är mindre än SVT/VALU som har en medelavvikelse på 0,73. Analysen visar med andra ord att modellen bättre prognostiserar valresultatet än SVT/VALU även för riksdagsvalet 2014. Detta även fast en individuell partivikt för Feministiskt initiativ inte har applicerats. Valprognosen är klart bättre än samtliga opinionsinstitut som använder sig av sannolikhetsurval (Oleskog Tryggvason, 2014). Det opinionsinstitut som kom närmast efter VALU i sin sistamätning inför valet var Novus med en medelavvikelse på 0,83. Det sammanlagda medelfelet för Sifo, Ipsos, Demoskop och Novus var klart sämre än den utvecklade modellen (1,21).

En ytterligare jämförelse vilken är intressant att undersöka är om användningen av raking har någon effekt på valprognosen och i så fall om den är positiv.

(24)

21

TABELL 6: VALPROGNOSER OCH TILLHÖRANDE STATISTIK FÖR VALET 2018 2018 PARTI VALU-

RÅDATA

MEDELAVVIKELSE(%) VALPROGNOS(%) VALU(%) VALRESULTAT(%)

M 17,6 18,72 19,13 17,8 19,84

C 10 9,38 9,85 9 8,61

L 6,7 5,82 5,81 5,5 5,49

KD 6,6 6,46 6,60 7,4 6,32

S 28,6 31,22 30,15 26,2 28,26

V 11,2 8,12 8,17 9 8,00

MP 6,3 4,74 5,18 4,2 4,41

SD 10,9 16,56 14,94 19,2 17,53

Övriga 1,9 1,37 1,39 1,8 1,53

Medelavvikelse 1,77 0,77 0,90 0,97

I tabell 6 redovisas prognosen för riksdagsvalet 2018 baserat på tre olika metoder:

SVT/VALU:s, Valprognos (författarens modell) samt en medelavvikelseprognos.

Medelavvikelseprognosen tar medelskillnaden i avvikelse mellan det två tidigare valen och VALU för varje parti vilket sedan multipliceras med VALU rådata, det vill säga, använder enbart partivikt. Den utvecklade modellen, Valprognos, prognostiserar valresultatet sämre än modellen som endast bygger på partivikt, vilket får anses som att raking med ålder, kön och facktillhörighet i detta avseendet inte haft en positiv effekt gällande att prognostisera valresultat.

Medelavvikelseprognosen presterar även bättre än SVT/VALU:s prognos med en medelavvikelse på 0,77 jämfört med SVT/VALU:s som har en medelavvikelse på 0,97.

Raking är känslig beroende på vilka variabler vi inkluderar i modellen, därför skulle det vara av intresse att jämföra med en modell där vi inkluderar en ytterligare variabel, exempelvis utbildningsnivå, i metoden. Anledningen till att utbildningsnivå skulle vara intressant att inkludera är för att det enligt teorin vad gällande trender i röstning finns ett betydande samband mellan vad en röstar på och utbildningsnivå. Således bör inkluderingen av utbildningsnivå kunna fånga upp eventuella skillnader i populationen vilket gör att modellen kan bättre representera den del av populationen som röstar i riksdagsvalet. För att se skillnader mellan

(25)

22

utbildningsnivån bland population och urval, se bilaga A. Anledningen varför utbildningsnivå inte har kunnat inkluderas för valprognosen 2018 är för att den inte fanns att tillgå vid skapandet av 2018 års partivikter, då utbildningsnivå bland urvalet inte var fångat i vallokalsundersökningarna 2010 och 2014. Således kan vi inte dra slutsatser om inkluderingen av den önskande variabeln, utbildningsnivå, skulle kunna förbättra estimaten för vår modell.

6. Diskussion

Syftet med studien har varit att prognosticera valresultatet för riksdagsvalet 2018. Genom att använda sig av en modell som tar hänsyn till systematiska skillnader gällande urvalsselektion och skiljaktigheter i bakomliggande sociodemografiska bakgrundsvariabler har en modell framställts som generellt bättre uppskattar valresultatet för 2018 års riksdagsval i jämförelse med VALU-prognos.

Generellt är modellen god på att förutspå valresultatet för samtliga partier förutom Socialdemokraterna och Sverigedemokraterna. Vid prognosen för riksdagsvalet 2014 är Socialdemokraterna det riksdagsparti som avviker mest. Att Socialdemokraterna är ett av de partier som avviker mest från valresultatet är naturligt tack vare att de är största parti.

Inkludering av facktillhörighet kan ha orsakat övervärderingen av Socialdemokraterna där facktillhörigheten har minskats sedan valdeltagarundersökningen 2014 och Socialdemokraterna är de parti som fackmedlemmar är överrepresenterade i jämförelse med valresultatet (SVT VALU, 2018). Inkludering av fler sociodemografiska bakgrundsvariabler, som till exempel var i landet personen bor (då det fortfarande finns skiljelinjer mellan röstande och region) och/eller utbildningsnivå skulle eventuellt kunna balansera upp felestimeringen av Socialdemokraterna samt Sverigedemokraterna och ge en bättre prognos.

Bland övriga partier har modellen sina begränsningar då den inte tar hänsyn till vilken konstellation av partier som finns inom denna grupp. Valprognosen för riksdagsvalet 2018 underskattade valresultatet, vilket har mycket att göra med att Feministiskt initiativ hade stor påverkan på partivikten för övriga partier då den baserades på de två tidigare valen där FI var överlägset största parti bland icke-riksdagspartier. Partivikten borde således ha kunnat korrigeras beroende på opinionsmätningar av övriga partier innan valet för att den så bra som möjligt ska kunna vara representativ för samtliga icke-riksdagspartier då trenderna visade på att FI inte skulle vara lika dominerande i denna kategori som föregående riksdagsval samt Alternativ för Sverige, ett högerparti, växt fram vilket borde bidragit till att vikten justerats upp.

Inkluderingen av partivikt får anses ha haft en god effekt på valprognosen men det för anses

(26)

23

vara naivt att endast basera partiviktnigen på medelavvikelsen mellan rakingprognosen och valresultatet för tidigare val då den inte tar hänsyn till förändringar i avseendet av partier.

När vi analyserar de konstruerade partivikterna vid 2018 riksdagsval kan vi se att alla partivikter går åt rätt håll, det vill säga justerar rakingprognosen mot valresultatet, samtliga partier förutom för Centerpartiet och Kristdemokraterna. Kristdemokraternas partivikt justerar valprognosen i rätt riktning för riksdagsvalet 2014. Inkludering av ytterligare bakgrundsvariabler skulle eventuellt kunna stabilisera deras valprognos och således få deras partivikt att gå åt rätt håll.

Förklaringen till att Centerpartiet partivikt går åt fel håll kan vara att partiet drivits mer åt vänster på den politiska skalan i jämförelse med det andra svenska partier under de fyra åren efter det föregående riksdagsvalet. I vallokalsundersökningen 2018 har Centerpartiets väljare placerat sig betydligt mer åt vänster än tidigare val när de svarat på följande fråga: ”Man talar ibland om att politiska åsikter kan placeras in på en vänster-högerskala. Var någonstans skulle Du placera in Dig själv?” (SVT VALU, 2018). Användningen av den informationen skulle i efterhand använts för att justera partivikterna eftersom vilken del av den politiska skalan väljarna anser att partiet ligger kan påverka den systematiska avvikelsen, då väljare mer åt vänster har större tendens att medverka i vallokalsundersökningen.

Användning av raking visade sig inte ha en positiv effekt på valprognosen vid användning de valda bakgrundsvariablerna för det aktuella data i jämförelse med en modell som endast baseras på historisk medelavvikelse. Det kan i sig inte fastslå att raking generellt vare sig är en sämre eller bättre metod än vare sig en modell som enbart bygger på historisk avvikelse eller poststratifiering och eventuellt metodval måste alltid tas i förhållande till den data och variabler som finns att tillgå.

Metoden fungerade överlag väl, den förutspådde valresultatet med högre precision än SVT/VALU för både riksdagsvalet 2014 och 2018. En modell som tar hänsyn till systematiska skillnader för urvalsselektion och sociodemografiska bakgrundsvariabler får anses som en god startpunkt vid prognostisering av valresultatet vid riksdagsval även om det finns rum för förbättringar.

(27)

24

6.1 Framtida Modell

Generellt är den utvecklade modellen god på att förutspå valresultatet för riksdagspartier men lämnar annat att önska för övriga partier. Att endast basera partivikten på medelavvikelsen i det två föregående valen för anses vara naivt.

(1) 𝑃𝑎𝑟𝑡𝑖𝑣𝑖𝑘𝑡_𝑖 = 𝑀𝑒𝑑𝑒𝑙𝑎𝑣𝑣𝑖𝑘𝑒𝑙𝑠𝑒_𝑖 + ∆𝑈𝑝𝑝𝑓𝑎𝑡𝑡𝑛𝑖𝑛𝑔_𝑖

Användningen av medelavvikelse bör istället ses som en grund för konstruktionen av partivikt vilket även tar förändringen i uppfattning av partiet i beaktning (som i Ekvation 1). Där bland annat avseendet av partiet utifrån höger-vänster-skalan, generell förändring i acceptans bland befolkningen samt förtroende för riksmedia (De som utför enkäten) bör tas i beaktning.

(2) 𝑉𝑎𝑙𝑝𝑟𝑜𝑔𝑛𝑜𝑠_𝑖 = 𝑉𝐴𝐿𝑈𝑟å𝑑𝑎𝑡𝑎_𝑖 × 𝑃𝑎𝑟𝑡𝑖𝑣𝑖𝑘𝑡_𝑖× ∑ ^𝑤^𝑗𝑖

𝑛 𝑛𝑗=1

Vidare bör även rakingvikten för en framtida modell baseras på fler variabler för att bättre fånga upp skillnader i populationen och vid användning av information för populationen för föregående val bör det även justeras för det aktuella valåret för att skapa en mer representativ bild över befolkningen som röstade.

7. Slutsats

Genom att prognostisera valresultatet med hjälp en modell som tar hänsyn till systematiska skillnader för urvalsselektion och sociodemografiska bakgrundsvariabler har författaren framställt en modell som generellt bättre uppskattar valresultatet för 2018 års riksdagsval i jämförelse med SVT/VALU:s egen prognos. Modellen är inte fläckfri, den vilar på ett par antaganden: Att valdeltagarna vid föregående val liknar det nuvarande i karaktäristika och att en systematisk skillnad i icke-deltagande i vallokalsundersökning kan minimeras med hjälp av en partivikt. Modellen fungerar bättre än SVT/VALU även för riksdagsvalet 2014. Modellen prognostiserar generellt de etablerade riksdagspartierna väl men tar inte hänsyn till stora partier som inte sitter i riksdagen eller förändringar i uppfattning av partier, så som partiers upplevda rörelse på höger-vänster-skalan, förändring i acceptans bland befolkningen samt förtroende för riksmedia. När en utvecklar en framtida modell föreslås de att dessa aspekter tas i beaktning.

När man analyserar politiska data bör man ständigt utvärdera det rådande politiska klimatet och med hjälp av detta bättre skapa prognoser över opinionen. Urvalssannolikheten verkar genomgående vara olika beroende på var på en höger-vänsterskala partiet tycks befinna sig, för framtida studier bör fokus just ligga på att utveckla en modell som förklarar skillnaderna i

(28)

25

urvalssannolikhet. Att basera analysen på information om valdeltagande är i sig bra men det rekommenderas att införskaffa mer bakgrundsinformation att basera rakingviktningen på samt även att använda en prognos för bakgrundskaraktäristikan av valdeltagare för det aktuella valåret, vilket eventuellt skulle kunna skapa ett stabilare estimat.

(29)

26

Tack

Jag skulle vilja uttrycka ett stort tack till min handledare Mattias Nordin som guidat mig under uppsatsens gång. Han har givit insiktsfulla diskussioner om forskningen vilket bidragit till ett ökat intresse för ämnesområdet. Mattias har med sin passion, förståelse och stödjande i lätta som svåra tider gjort att jag evigt kommer vara tacksam och glad över att jag fått chansen att lära känna honom.

Jag skulle även vilja rikta ett tack till Anton, Eivin, Siv och Annika som stöttat mig under resans gång.

Гора с горой не сходится а человек с человеком всегда сойдется.

(30)

27

Referenser

Alreck, P. L., & Settle, R. B. (1995). The Survey Research Handbook. Chicago: Richard D. Irwin.

Babbie, E. R. (1990). Survey research methods Wadsworth Pub. Co Belmont, Calif, 3(9).

Barnes, F. (1992). The family gap. Reader’s Digest, 48-54.

Brick, J. M. (2013). Unit nonresponse and weighting adjustments: A critical review.

Brick, J. M., & Kalton, G. (1996). Handling missing data in survey research. Statistical methods in medical research, 5(3), 215-238.

Brick, J. M., & Montaquila, J. M. (2009). Nonresponse and weighting. In Handbook of Statistics (Vol.

29, pp. 163-185). Elsevier.

Deville, J. C., Särndal, C. E., & Sautory, O. (1993). Generalized raking procedures in survey sampling. Journal of the American statistical Association, 88(423), 1013-1020.

Farrant, G., & O’Muircheartaigh, C. (1991). Components of nonresponse bias in the British Election Surveys. Understanding Political Change. Pergamon, Oxford, 235-249.

Groves, R. M. (2006). Nonresponse rates and nonresponse bias in household surveys. Public opinion quarterly, 70(5), 646-675.

Holt, D., & Smith, T. F. (1979). Post stratification. Journal of the Royal Statistical Society: Series A (General), 142(1), 33-46.

JONES, J. M. B. M. E. (2008). Propensity to respond and nonresponse bias. Metron, 66(1), 51-73.

Kalton, G. (1983). Compensating for missing survey data.

Kalton, G., & Flores-Cervantes, I. (2003). Weighting methods. Journal of official statistics, 19(2), 81.

Kalton, G., & Maligalig, D. S. (1991). A comparison of methods of weighting adjustment for

nonresponse. In Proceedings of the 1991 Annual Research Conference (Vol. 409428). Washington, DC: US Bureau of the Census.

Lynn, P. (1996). Weighting for non-response. Survey and statistical computing, 205-214.

McDaniel, S. W., Madden, C. S., & Verille, P. (1987). Do topic differences affect survey non- response?. Journal of the Market Research Society.

Oleskog Tryggvason, P. (2018). Polling accuracy in Swedish general election 2018. SNES working report, 6.

Oleskog Tryggvason, P. (2014). Vikten av vikter: Sammanställning av viktade resultat från SVTs vallokalsundersökning 2014. Valforskningsprogrammets arbetsrapportserie 2014, 13.

Oscarsson, H., & Holmberg, S. (2013). Nya svenska väljare. Norstedts Juridik AB.

Oscarsson, H., 1972, & Holmberg, S., 1943. (2016). Svenska väljare (Upplaga 1:1 ed.). Stockholm:

Wolters Kluwer.

Peytcheva, E., & Groves, R. M. (2009). Using variation in response rates of demographic subgroups as evidence of nonresponse bias in survey estimates. Journal of Official Statistics, 25(2), 193.

(31)

28

SCB (2019): Allmänna val, valdeltagandeundersökningen https://www.scb.se/hitta-statistik/statistik- efter-amne/demokrati/allmanna-val/allmanna-val-valdeltagandeundersokningen/ [Hämtad 2019-05- 04].

SVT VALU (2018): SVT:s Vallokalsundersökning Riksdagsvalet 2018 https://www.svt.se/omoss/media/filer_public/5c/17/5c17fc91-31c4-4e0a-a17f-

b42318edf4a4/valuresultat_riksdagsval_pk_2018_vagda_0912.pdf [Hämtad 2019-05-04].

Särndal, C. E. (2011). Three Factors to Signal Non‐Response Bias With Applications to Categorical Auxiliary Variables. International statistical review, 79(2), 233-254.

VALU 2018 (2018) - SVT:s vallokalsundersökning riksdagsvalet 2018 https://snd.gu.se/sv/catalogue/study/snd1067 [Hämtad 2019-05-04].

(32)

29

Bilaga A

Figur 4: Andelen med respektive utbildningsnivå bland svarande i VALU 2018 vs valdeltagare 2014. Mätt i procent.

Utbildningsnivån bland valdeltagare 2014 och vallokalsundersökningen 2018, figur 4, visar att de med eftergymnasial utbildning har större tendens att medverka i undersökningen i jämförelse med lägre utbildade. Eftergymnasialutbildade uppgår till 65 % av urvalet i förhållande till 38 % av populationen. De med gymnasial utbildning eller lägre är underrepresenterade i urvalet vilket medför att de, allt annat lika, kommer få en större vikt.