• No results found

Metoden för utvärdering av aggregeringarna

PROCENT AV OMRÅDEN

8.1 Metoden för utvärdering av aggregeringarna

Det finns två olika delar av metoden, den ena handlar om utvärderingen av personlig integritet, och den andra om utvärderingen av användbarhet. Dessa går in i varandra, men för enkelhets skull kommer först metoden för att beräkna personlig integritet tas upp, för att senare problematisera operationaliseringen av användbarhet.

Metoden har två kriterier för att den personliga integriteten ska slås vakt om. Den första är att inget område får ha helt identifierbara individer, det vill säga att 0% eller 100% av befolkningen kan inte omfattas av den aktuella personuppgiften. Det andra var att avvikelsen från medelvärdet inte får överskrida mer än två globala standardavvikelser. För alla arealbaserade aggregeringar som utvärderades förutom kommuner så fanns det en andel områden med 0% biståndstagare kvar. Enligt de kriterier som utformades i metoden gör det att inga arealbaserade aggregeringar kan sägas fungera utom kommuner, som i sin tur är så stora att de inte är användbara. Men är det en svaghet i områdesaggregeringarna eller snarare i hur metoden är utformad?

Det som framförallt diskvalificerar områdesindelningarna är kriteriet att inga områden får innehålla 0% biståndstagare. Därför är det väsentligt att diskutera varför detta kriterium finns. Framförallt är det på grund av tolkningen av lagen. GDPR gör det tydligt att inga personuppgifter får göras helt öppna. En personuppgift är en uppgift som avser en identifierad eller identifierbar fysisk person och inbegriper allt som kan avvändas för att identifiera en person (Wendleby and Wetterberg, 2018). Med den logiken bör även uppgiften om man inte är en biståndstagare vara en personuppgift. Som följd är det därför logiskt att sätta ett kriterium att det inte kan finnas områden där det är 0% biståndstagare. Det är möjligt är att det finns andra

68

legala tolkningar att tillämpa i specifika fall, men utifrån den information som finns är detta den logiska slutsatsen.

Etisk kan förstås denna hårda gräns ifrågasättas. I kapitlet om dataetik debatterades varför det är viktigt att skydda individers personuppgifter. En viktig anledning är för att skydda individer mot risken för våld eller diskriminering (Floridi och Taddeo, 2016). Att någon skulle diskrimineras för att de garanterat inte har ekonomiskt bistånd är osannolikt, då detta stämmer för den absoluta majoriteten av befolkningen (96,4% år 2014). Dock så kan det argumenteras att det skulle vara mycket märkbart om någon som hade ekonomiskt bistånd flyttade in i dessa områden, och skulle löpa stor risk för att bli utpekad genom att statistiken ökade från ett år till ett annat. Detta är dock lite långsökt, för om det inte bara var en enstaka person som flyttade in under hela den perioden så kan det inte sägas med säkerhet vem personuppgiften tillhör. En annan anledning att skydda individers personuppgifter är för att alla har rätt till ett privatliv enligt lag. Definitionen av rätten till ett privatliv har varit mycket omdebatterad, men den definition som används i denna studie är att det är rätten till kontrollen av informationsflödet om sig själv (se Marmor, 2015, Jarvis Thomson, 1975, Johnson, 2001). Jarvis Thomson utvecklade denna tolkning för att hon såg behov att ha en vidare definition av privatlivet för att hinna med teknikens utveckling. Från 1970 talet har denna utveckling kommit oerhört lågt, men som Marmor (2015) argumenterar är Jarvis Thomsons definition fortfarande applicerbar. Enligt den tolkningen kan även spridning av information om att en individ inte är ekonomiskt biståndstagare anses vara en kränkning. Dock är följdfrågan om det kan anses vara en kränkning som är större än nyttan av att kunna använda informationen?

I regeringsformen 2 kap 6 § st. 2 står det att ” var och en är gentemot det allmänna skyddad mot

betydande intrång i den personliga integriteten.”. Att ordet betydande är inkluderat i lagen är

viktigt eftersom det pekar på det faktum som varit ett genomgående tema i denna studie; Kränkningen av individens integritet måste alltid vägas mot nyttan av kränkningen för det allmännas intresse. Detta går ihop med argumentet Ekholm (2016) för om att datainsamling kan anses vara en del av samhällskontraktet. Ekholm uttrycker att större data användning är positivt för hela samhället. Men han uppmärksammar också att det finns en privat dimension i data, vilket han besvara med att det ändå finns agenter med legitima krav på datamaterial om individer. Den delen av Ekholms argument gör att det är svårt att sträcka hans definition av samhällskontraktet till öppna myndighetsdata. Öppna mydníghetsdata är inte bara öppet till de med legitima krav, utan är kravlöst öppet för alla. Om krav ska finns på användaren handlar det snarare om PSI (Eriksson, 2014).

Det finns bevis på att öppna myndighetsdata har stor potential för nytta i samhället, såsom det redogjorts för i bakgrunden. Öppna myndighetsdata kan bidra till transparens i myndighetsutövandet, ha stora sociala och kommersiella värden och främja medborgarmedverkan (Attard et al., 2015). Men är den förlusten av kontroll på informationsflödet för individen proportionerligt mot nyttan? Öppna data skapar per definition

69

förlust av kontroll på informationsflödet, då vem som helst ska kunna tillägna sig och använda öppna data helt fritt. Därtill är det svårt att kvantifiera nyttan med öppna data då nyttan inte kan mätas utan bara uppskattas (se exempelvis Lakomaa, 2016). Därtill är det svårt att bedöma hur stor kränkning en kartläggning av personer som inte har ekonomiskt bistånd kan anses vara. Precis som måttet på integritet är även definitionen av användbarhet en faktor som påverkar analysen. Användbarhet har operationaliserats i denna studie som att datamaterialet är så nära originaldatamaterialet som möjligt. Både graden av aggregering av variablerna är del i det, samt hur väl geografin bevaras. Anledningen till att denna operationalisering gjordes var till viss del för att det stöddes av de åtta principerna för öppna myndighetsdata och för att detaljnivån efterfrågas av intressenter (se exempelvis Bisnode, 2018 och opengovdata.org, 2019). Framförallt är anledningen att bevarandet av en geografisk detaljnivå är kritiskt för geografiska analyser. Detta blir extra tydligt på grund av MAUP-effekter, där en grövre geografisk upplösning inte bara leder till att analyser blir sämre, utan också kan snedvrida resultat. Tidigare forskning har räknat på hur MAUP kan felrepresentera olika variabler (se exempelvis Openshaw, 1984 och Fotheringham och Wong, 1991). Detta angreppsätt skulle kunna användas för att få en bättre bild av hur bra olika aggregeringar fungerar, snarare än att endast förenkla det till en slutsats om att en högre detaljnivå automatiskt är bättre. Problemet där är att det går emot syftet att skapa ett generellt underlag, då en sådan analys skulle behöva göras för alla olika variabler. Olika indelningar representerar olika variabler olika bra, men generellt sett är blir det mindre MAUP-påverkan ju mindre enheterna är (Openshaw, 1984, Fotheringham and Wong, 1991). Därför gjordes operationaliseringen i denna studie att så att ju mer detaljrikt ett datamaterial är, desto högre användbarhet kan det antas ha.

Med den definitionen, går det att etiskt ifrågasätta om inte nyttan att få användbara detaljrika data kan vara värd den kränkning som sker i spridningen av data. Den restriktiva lagstiftningen ifrågasattes till exempel i kapitel 4.2 av Sloot (2017), som argumenterade att det är för stor betoning på individens rätt gentemot det allmännas intresse. I resultatet dolde k-närmaste granne på 10 grannar alla områden som hade 100% biståndstagare. Det är en oerhört fin nivå väldigt nära individen, som därför kan anses vara mycket användbar. Men kravet på att inga områden får ha 0% biståndstagare gör att k=10 inte kan användas. Även den arealbaserade aggregeringen DESO skulle troligtvis skulle fungera väl om kravet på 0% togs bort.

Det är viktigt att lyfta frågan om områden med 0% ekonomiskt biståndstagande är etiskt försvarbart att sprida, eftersom det också visar att bedömningen alltid kommer att påverkas av det specifika fallet. Syftet med denna studie är att skapa en metod som är generell och kan användas för många olika variabler. För ekonomiskt bistånd kanske inte områden med 0% är särskilt skadliga att lämna ut uppgifter om. Detsamma stämmer inte nödvändigtvis för andra personuppgifter. Bara detta faktum är ett argument för att ha kvar detta kriterium för det generella måttet, men med insikt om att det generella måttet alltid måste ställas mot varje personuppgifts specifika kontext. En generell metod kommer aldrig att vara helt gångbar, men

70

den kan fortfarande ha möjlighet att vara ett av de underlag som används för att göra bedömningen från fall till fall. För att denna metod ska vara användbar måste det finnas garantier för att lagen följs. Därför måste man utgå från att det inte är möjligt att lämna ut områden med 0%, utifrån den tolkning av lagen som gjorts i denna text.

Angående olika variabler så är det viktigt att diskutera hur materialet och variabeln som valdes kan ha påverkat studien. Det är ovanligt att vara ekonomisk biståndstagare, som visats gäller det endast 3,6% av Sveriges befolkning. Metodens syfte är att vara generellt användbar, så hur skulle då metoden fungera på andra variabler?

För att utvärdera detta kan man titta på orsaker till att resultatet fick så stora andelar områden med 0% biståndstagare. Det som framförallt bidrog är att det är få som är ekonomiska biståndstagare, och de få som finns är ofta är koncentrerade till storstadsregioner (Socialstyrelsen, 2013). Detta gör att det speciellt i glesbygdsområden är väldigt svårt att skapa områden som innehåller biståndstagare, och ofta så krävs ett så stort geografiskt område att det är svårt att tala om grannskap. Det geografiska mönstret är en försvårande faktor, men att det finns är också en grundläggande anledning till att geografiska aggregeringar är viktiga: just för att det finns mönster. Det faktumet visar än en gång på vikten att väga personlig integritet mot användbarhet, eftersom geografi har betydelse blir de möjliga analyser man gör sämre desto mer geografin döljs.

Intressant är att 0% biståndstagare i ett område är mindre än en global standardavvikelse från medelvärdet, vilket gör det till ett accepterat värde enligt ekvation 1. Detta beror på att medelvärdet 3,6% ligger mycket nära 0% för variabeln. Detta visar på vikten att kombinera kravet på att det inte ska vara för hög avvikelse med kravet på att det inte ska vara 0% eller 100%. Denna del av metoden är även viktig att diskutera vidare, för även den påverkas av vilken variabel som utvärderas. Som tidigare nämnts är gränsen på 2 standardavvikelser en arbiträr gräns. Gränsen valdes på grund av att 5% är en vanlig gräns för vad som är statistiskt signifikant för en population. Den gräns som sätts handlar alltså om vad som anses vara en proportionerlig delmängd av populationen. Till exempel, i ett område med 10 personer är 9 personer oproportionerligt många ekonomiska biståndstagare.

Varför sätta en gräns för vad som är oproportionerligt många? Denna del av måttet är utanför den basgräns som lagen sätter eftersom skyddet från nuvarande lag upphör tvärt när en person inte längre är identifierbar (Wendleby and Wetterberg, 2018). Detta mått är med eftersom syftet var att ge underlag för en etisk avvägning, och inte bara att lagen följs. Det finns två anledningar till att den etiska avvägningen är intressant att göra. Den ena anledningen är för att utvärdera om oddset att gissa vem som har en personuppgift är för stor. Visserligen har man i det hypotetiska området på 10 personer inte sagt vilka som har ekonomiskt bistånd, men om chansen att gissa rätt är 90% kan det anses vara för stort. Den andra anledningen är att även om en stor delmängd biståndstagare inte identifierar en individ som biståndstagare, kan det tydligt peka ut en grupp. Som Floridi (2014) tar upp kan även grupper diskrimineras. Floridis argument

71

att man måste värna om till gruppen rätt till ett privatliv tillför ytterligare en nivå av komplexitet till avvägningen mellan individers rätt och det allmänna intresset. Även om den tolkningen inte finns i lagstiftningen, lyfter den upp det faktum att det kan vara skadligt för individen att bli utpekad i grupp även när hen inte är helt identifierad. Med det geografiska perspektivet kan man då argumentera för att det finns en fara i att diskriminera ett område, och därmed individerna däri. Exempelvis finns det i ett område med en hög andel ekonomiska biståndstagare en risk för stigmatisering eller diskriminering (Starrin and Kalander Blomqvist, 2001). Med bakgrund i detta så fanns det anledning att lägga till en gräns på när en grupp är oproportionerligt synlig.

Alternativt skulle det vara möjligt att bara sätta en gräns för hur stor eller liten del av befolkningen som får omfattas av uppgiften, och inte använda sig av standardavvikelser. Till exempel att delmängden biståndstagare inte får överskrida 90% och inte underskrida 10%. Vad som är en alltför oproportionerligt hög procent är helt bundet till vad för uppgifter materialet innehåller samt vilka etiska ställningstaganden som behöver tas avseende hur känslig uppgiften är. Anledningen till att antal globala standardavvikelser istället valdes var att få ett mått som kan användas för en mängd variabler, och tar hänsyn till hur vanligt förekommande de är. Antal standardavvikelser var i sin tur baserat på ett antagande om att sannolikheten för variabeln är normalfördelad. Analysen visade att detta inte helt var fallet för ekonomiskt bistånd, då 0% föll innanför gränsen på två globala standardavvikelser, trots att det inte går att ha mindre än 0% biståndstagare i ett område. Även om antagandet inte visade sig stämma helt, är det fortfarande ett relevant antagande att göra eftersom sannolikheten i de flesta fall är approximativt normalfördelad. Om det är en specifik variabel som ska utvärderas så kan det vara värt att utforska fördelningen och ändra gränserna därefter, men som ett generellt mått är ett antagande om en normalfördelad struktur fortfarande användbart. Det är dock viktigt att ta upp detta fel, eftersom det visar att modellen aldrig kommer passa perfekt. Eftersom det är ett generellt mått så fungerar bedömning bäst som indikation för vilka procentandelar som kan anses godtagbara, snarare än ett helt säkerställt beslutsmaterial.

Det går inte att komma ifrån att det är svårt att beräkna personlig integritet med en formel. Det är ett etiskt beslut att göra en avvägning mellan användbarhet och personlig integritet som alltid är beroende av vilken eller vilka uppgifter det handlar om. Det som denna metod kan tillföra är ett underlag att göra denna analys utifrån, vilket också var det grundläggande syftet.