SAMMANFATTNING OCH SLUTSATSER - PROCENT AV OMRÅDEN

PROCENT AV OMRÅDEN

9. SAMMANFATTNING OCH SLUTSATSER

Syftet med denna studie har varit att utforska hur myndigheter kan öppna datamaterial som innehåller individinformation på ett lagligt, etiskt och användbart sätt. Ambitionen kan sägas vara tvådelad. Först eftersträvades att undersöka en möjlig metod för att utvärdera integritet och användbarhet i områdena. Detta speglades i de två underställda frågeställningarna,

”Hur kan grad av personlig integritet i data utvärderas?” och ”Hur kan användbarheten av data i geografiska aggregeringar utvärderas?”. Därefter användes denna metod för att utforska

vilka geografiska aggregeringar som kan passa att öppna data i, och besvara grundfrågeställningen: ”Hur kan geografiska aggregeringar användas för att bevara personlig

integritet och användbarhet när öppna data skapas?”

Operationaliseringen av personlig integritet byggdes på lagens krav att ingen individ får vara identifierbar, vilket innebar att inget område fick ha 100% eller 0% biståndstagare då detta gör en personuppgift identifierbar för alla i området. Att kunna gissa att någon är ekonomisk biståndstagare med 100% säkerhet är ett tydligt problem. Men det är även ett problem att kunna gissa, inte med 100 procent säkerhet men med stor säkert, att någon är mottagare av ekonomiskt bistånd. Därtill finns även risk för diskriminering av tydligt identifierade grupper. Därför skapades även en ekvation för att beräkna om en delgrupp kunde anses oproportionerligt tydlig inom ett område. Måttet baserades på antal globala standardavvikelser från det globala medelvärdet. Anledningen till att standardavvikelser valdes var för att kunna skapa en så generellt användbar måttstock som möjligt, och som skulle kunna brukas avseende vilken personuppgift som helst. Valet av hur många standardavvikelser som anses vara proportionerligt drogs vid 2, men denna gräns är högst modifierbar.

Detta sätt att räkna på sannolikheter är ett grepp för att analysera personlig integritet som har stöd i lagstiftningens krav på att ingen individ får bli identifierad. Det stöds även av den etiska diskussionen om individens kontroll över sin information samt även att skyddet av gruppen är viktig. Dock så är det tydligt att det aldrig helt går att fastställa ett kvantifierbart mått på integritet, utan valet kommer alltid att kräva reflektion och etiska beslut, till exempel om i vilken grad en grupp kan vara identifierbar och sannolikheten för att en individ kan identifieras. Detsamma gäller för avvägningen mot användbarhet. Användbarhet identifierades som att rådatamaterialets detaljnivå bevarades. Högre detaljnivå innebär ett närmande till individen, och därför kommer användbarhet och integritet sannolikt alltid vara motsatta värden, som behöver vägas mot varandra. För att båda värdena ska uppnås måste en balans finnas.

Sammanfattningsvis kan det sägas att det är komplext och svårt att väga integritet mot användbarhet, speciellt eftersom personlig integritet är kulturellt bunden och ett svårdefinierat koncept. Detta innebär inte att man inte bör försöka utvärdera skyddet av den personliga integriteten och vikta det mot användbarhet. Som samhälle tjänar vi inte på att bli för paralyserade och överdrivet restriktiva. Fördelarna med öppna data är stora, och ju mer

detaljrikt datamaterial som kan delas desto högre chans är det att värdefull forskning kan göras och innovationer kan främjas. Som avsnittet om MAUP visar kan det bli direkt missvisande och fel om data delas på för grov nivå. I analysen utvärderas ett flertal olika geografiska aggregeringars möjligheter att bevara integritet. Både svenska arealbaserade områden och bespoke neighborhood metoder behandlades.

De arealbaserade områdena innebar flera problem där de antingen gick till alltför granulär nivå för att vara integritetsbevarande, som SAMS-områden. Eller så uppfylldes kraven för bevara integriteten men istället blev datamaterialet aggregerat till så hög nivå att de inte längre kan anses användbart, som kommunal nivå.

Områdesindelningen enligt DESO är den arealbaserade indelningen som närmast kom att uppfylla både kravet på integritet och användbarhet. Detta är direkt kopplat till att DESO-indelningen har en övre och undre gräns på antal invånare i områdena. Hur väl integriteten skyddas är direkt kopplat till antalet individer inom området, och därför passar en områdesindelning som tar hänsyn till detta mycket bättre än en som främst baserar sig på den fysiska geografin. Men i slutänden fungerade inte heller DESO indelningen på grund av att det fanns 1,1% områden med 0% biståndstagare. 1,1% är en liten andel, men en så liten andel gör att en arealbaserad aggregering inte fungerar eftersom det inte finns några möjligheter att anpassa den.

Därför kan k-närmaste granne vara ett relevant alternativ till arealbaserade områdesindelningar. K-närmaste granne är skalbart efter hur många individer som inkluderas i grannskapen. I undersökningen av indelningar enligt k-närmaste granne visade det sig att k=1 280 grannar var mycket nära att uppfylla alla integritetskrav, både för att inga områden ska ha helt identifierbara invånare eller en delmängd över två globala standardavvikelser från globala medelvärdet. Det tyder på att bara en aningen större indelning skulle kunna vara en lösning för att öppna datamaterial med ekonomiska biståndstagare.

Om något har bevisats så är det att geografiska aggregeringar är ett möjligt verktyg som helhet för att bevara integritet och användbarhet när öppna data skapas. Aggregeringen är en gångbar kompromiss mellan att helt ta bort personuppgifter i öppna data och att lämna ut utan hänsyn till individens personliga integritet. Att bevara geografin i sig är en stor fördel för användbarheten av datamaterial. Detta inte bara för att öppna data med geografi efterfrågas, utan att det även finns en betydande forskning inom det geografiska forskningsområdet som visar vad den geografiska dimensionen kan bidra med i analyser.

Den svåra balansakten mellan personlig integritet och användbarhet är möjlig att uppnå med geografiska aggregeringar. I synnerhet så har denna studie visar att k-närmaste granne som aggregeringsmetod är ett viktigt verktyg för att hitta en jämvikt. Även om denna studie endast behandlade personuppgiften ekonomiskt bistånd, är resultaten användbara för datamaterial med personuppgifter i stort. Metoden kan fungera som ett underlag för offentlig verksamhet för att

kunna ta ställning till om data kan lämnas ut på olika nivåer och vad som är fördelen med olika skalor. Detta kan i sin tur förhoppningsvis leda till att mer data öppnas, med alla de fördelar det ger för transparens, medborgarmedverkan, innovation och forskning.

Metoden skulle möjligtvis även kunna användas för andra syften än att utvärdera möjligheten för att öppna data helt. Det kan exempelvis vara relevant även när data lämnas ut med villkor, som exempelvis för forskning. Vid samhällsnyttig forskning kan nyttan beskrivas tydligt, medan syftet med användningen inte ens bör ifrågasättas när det gäller öppna data. Därför är det en annorlunda avvägning som görs mellan användbarhet och integritet när det gäller forskningsändamål. Att lämna ut data på individnivå innebär en hög grad av användbarhet, men som alltid bör ställas mot integritetsaspekterna. Metoden kan möjligen också användas för att beräkna vilka förluster av kvalitet i data som blir resultatet när aggregeringar används för att skydda individens integritet.

Metoden ska inte ses som ett perfekt verktyg, utan snarare ett första steg mot att våga ta i dessa frågor. Ett underlag för att väga den personliga integriteten mot användbarhet, inte bara för att följa lagen utan också för att ta etiska och välmotiverade beslut. Det är en metod för utvärdering som kan och bör byggas vidare på, för att skapa så goda möjligheter som möjligt för integritetskyddade och användbara öppna myndighetsdata.

Tackord

Jag vill tacka min handledare John Östh, som har stöttat mig genom hela processen. Din erfarenhet och kunskap har varit ovärderlig i mitt arbete. Jag vill också tacka Marina Toger, Philippa Nilsson och Filippa Annersten för er värdefulla expertis och era råd. Jag vill också tacka min pappa och mamma för deras fantastiska stöd.

REFERENSER

Amcoff, J. (2012) Hur bra fungerar SAMS-områdena i studier av grannskapseffekter? En studie av SAMS-områdenas homogenitet, Socialvetenskaplig Tidskrift, 19(2), s. 93–115.

Amcoff, J. (2013) Urban Geography The Importance of Geographic Data Compilation Units in Monitoring Metropolitan Versus Nonmetropolitan or Urban Versus Rural Population Change. Urban Geography, 27:8, s. 757–767.

Attard, J. et al. (2015) A systematic review of open government data initiatives, Government

Information Quarterly, 32, s. 399–418.

Batty, M., & Sikdar, P. K. (1982). Spatial Aggregation in Gravity Models. 1. An Information-Theoretic Framework. Environment and Planning A: Economy and Space, 14(3), 377– 405.

Bisnode (2018) ÖPPNA DATA = INNOVATION!. Stockholm: Bisnode.

Brandeis, L. D. och Warren, S. (1890) The Right to Privacy, Harv. L. Rev., 4(5), s. 193–220. Ekholm, A. (2016) ”Det digitala samhällskontraktet” Ingår i: Det sociala kontraktet i en digital

tid, Temarapport 2016:2, Digitaliseringskommissionen (red). Stockholm: Digitaliseringskommissionen s. 37–48

Eriksson, J. (2014) Öppna myndigheten: information och ärenden i e-förvaltningen. Stockholm: SKL Kommentus.

Floridi, L. (2010) The Cambridge handbook of information and computer ethics, Cambridge: Cambridge University Press

Floridi, L. (2014) Open Data, Data Protection, and Group Privacy, Philosophy & Technology.

Springer Netherlands, 27(1), s. 1–3.

Floridi, L. och Taddeo, M. (2016) What is data ethics?, Philosophical Transactions of the Royal

Society A: Mathematical, Physical and Engineering Sciences. 374, 2083

Fotheringham, A. S. och Wong, W. S. (1991) The modifiable areal unit problem in multivariate statistical analysis, Environment and Planning A. 23(7), s. 1025–1044

Galster, G. (2001) On the nature of neighbourhood, Urban Studies, 38(12), s. 2111–2124. Gren, M. et al. (2003) Kulturgeografi: en ämnesteoretisk introduktion. Liber.

Janssen, M., Charalabidis, Y. och Zuiderwijk, A. (2012) Benefits, Adoption Barriers and Myths of Open Data and Open, Information Systems Management, 29, s. 258–268.

Jarvis Thomson, J. (1975) The Right to Privacy, Philosophy & Public Affairs, 4(4).

Jha, S., Kruger, L. och McDaniel, P. (2005) Privacy Preserving Clustering, Ingår iComputer Security – ESORICS 2005. Springer, Berlin, Heidelberg, s. 397–417.

Johnson, D. G. (2001) Computer ethics. New Jersey: Prentice Hall.

Kassen, M. (2017) Understanding transparency of government from a Nordic perspective: open government and open data movement as a multidimensional collaborative phenomenon in Sweden Understanding transparency of government, Journal of Global Information

Lakomaa, E. och Kallberg, J. (2013) Open data as a foundation for innovation: The enabling effect of free public sector information for entrepreneurs, IEEE Access. IEEE, 1, s. 558– 563.

Lakomaa, E. (2016) Samhällsekonomisk effekt av öppna geodata, SSE Working Paper Series

in Economic History No. 2016:3

Marmor, A. (2015) What Is the Right to Privacy?, Philosophy & Public Affairs, 43(1), s. 3–26. Martin, D., Cockings, S. och Leung, S. (2015) Annals of the Association of American Geographers Developing a Flexible Framework for Spatiotemporal Population Modeling. Annals Of The Association Of American Geographers, s. 1-20

Molloy, J. C. (2011) The Open Knowledge Foundation: Open Data Means Better Science, PLoS

Biology, 9(12)

Moore, A. D. (2005) Information ethics: privacy, property, and power. Washington: University of Washington Press.

Moore, D. S., McCabe, G. P. och Craig, B. A. (2009) Introduction to the practice of statistics, 6th ed. W.H. Freeman

Neethling, J. (2005) Institute of Foreign and Comparative Law Personality rights: a comparative overview, The Comparative and International Law Journal of Southern Africa. 2, s. 210 - 245

OECD (a2018) OECD Reviews of Digital Transformation: Going Digital in Sweden. Prais, OECD Publishing

OECD (b2018) Key findings Digital Government Review of Sweden Enabling government as a

platform through a data-driven public sector. Paris, OECD Publishing

Openshaw, S. (1984) Ecological fallacies and the analysis of areal census data, Environment

and Planning A. 16(1), s. 17–31

Openshaw, S. och Taylor, P. J. (1979) A million or so correlation coefficients: three experiments on the modifiable areal unit problem, Statistical Applications in the Spatial

Sciences, s. 127–144.

Openshaw, S. Charlton, M., Wymer, C. och Craft A. (1987) A Mark 1 Geographical Analysis Machine for the automated analysis of point data sets, International Journal of

Geographical Information Systems, 1(4), s. 335-358

Propper, C. et al. (2005) ‘Local neighbourhood and mental health: Evidence from the UK’,

Social Science & Medicine. Pergamon, 61(10), s. 2065–2083.

Rousseau, J.-J. et al. (2009) Om samhällsfördraget eller Statsrättens grunder. Natur & kultur (Levande litteratur).

Rousseau, J. J., Rousseau, J. J. och De Geneve, C. (1782) Ou Principes du Droit Politique. Sloot, B. van der (2017) Privacy as virtue : moving beyond the individual in the age of Big

Data.Cambridge, Intersentia Cambridge

Socialstyrelsen (2013) Ekonomiskt bistånd - Handbok för socialtjänsten. Socialstyrelsen. Starrin, B. och Kalander Blomqvist, M. (2001) Det är den där skammen... skammen att inte

klara sig själv: En studie om socialbidragstagares ekonomiska, sociala och hälsomässiga förhållanden. Karlstads universitet. Arbetsrapport nr 4, 2001.

Stein, R. E. (2014) Neighborhood Scale and Collective Efficacy: Does Size Matter?, Sociology

Compass. John Wiley & Sons, Ltd (10.1111), 8(2), s. 119–128.

Tobler, W. R. (1970) A Computer Movie Simulation Urban Growth in Detroit Region,

Economic Geography, 46, s. 234–240.

Ubaldi, B. (2013) Open Government Data: Towards Empirical Analysis of Open Government Data Initiativ, OECD WorkinPapers on Public Governance, (No. 2).

Wendleby, M. och Wetterberg, D. (2018) Dataskyddsförordningen GDPR: förstå och tillämpa

i praktiken 1st ed. Stockholm: Sanoma Utbildning. Tryckfrihetsförordning (1949). Stockholm, Justitiedepartementet L6. Tryckfrihetsförordning TF 1949:105

Türk, U., Andreoli, F., Östh, J., Peluso, E. (2019) The Gini index of spatial economic segregation : Definition and application to Sweden. Working Paper Series Department of

Economics University of Verona.

Türk, U. och Östh, J. (2017) Inequality of Opportunity in Sweden: A Spatial Perspective,

Working Paper Series Department of Economics University of Verona.

Zuiderwijk, A. et al. (2016) The wicked problem of commercial value creation in open data ecosystems: Policy guidelines for governments, Information Polity. IOS Press, 21, s. 223– 236.

Östh, J., Clark, W. A. V. och Malmberg, B. (2015) Measuring the scale of segregation using k-nearest neighbor aggregates, Geographical Analysis. s. 34-49

Östh, J. och Türk, U. (2019) Integrating infrastructure and accessibility in measures of bespoke neighbourhoods, Ingår i: Musterd S (ed) Handbook on Urban segregation. Edward Elgar. Cheltenham: Edward Elgar Publishing

Elektroniska källor

Amnesia “Amnesia — data anonymization made easy”,

https://amnesia.openaire.eu/amnesiaInfo.html [Hämtad den 2019-01-25].

Datainspektionen ” Lagar och regler – Datainspektionen”,

https://www.datainspektionen.se/lagar--regler/ [Hämtad den 2019-02-04].

European Data Protal, “Open data in Europe”,

https://www.europeandataportal.eu/en/dashboard#tab-map [Hämtad den 2019-03-10] Geodata.se, 2019, ”Inspire”, https://www.geodata.se/styrande/inspire/ [Hämtad den

2019-04-07].

Global Open data index, “Sweden”, https://index.okfn.org/place/se/ [Hämtad den 2019-05-10]

Open Data Barometer, “Open Data Barometer 4th edition”,

https://opendatabarometer.org/4thedition/?_year=2016&indicator=ODB [Hämtad den 2019-03-10]

Opengovdata.org, ”The Annotated 8 Principles of Open Government Data” https://opengovdata.org/ [Hämtad den 2019-04-20].

SCB. ”DeSO – Demografiska statistikområden”, https://www.scb.se/hitta-statistik/regional-statistik-och-kartor/regionala-indelningar/deso---demografiska-statistikomraden/ [Hämtad den 2019-03-10].

DIGG ”Den offentliga sektorn skapar och använder stora mängder data.”, https://www.digg.se/utveckling--innovation/oppna-data-och-datadriven-innovation

[Hämtad den 2019-04-01].

Wikipedia, ”Normalfördelning”, https://sv.wikipedia.org/wiki/Normalf%C3%B6rdelning, [Hämtad den 2019-04-17].

Öppnadata.se, ”Om oss – Den nationella portalen för öppna data och PSI.”, https://oppnadata.se/projektet/ [Hämtad den 2019-04-01].

In document UPPSATSER Kulturgeografiska institutionen (Page 80-87)