• No results found

Utmaningar för geografisk aggregering

5. GEOGRAFISKA AGGREGERINGAR

5.1 Utmaningar för geografisk aggregering

Som argumenterat har geografiska aggregeringar en stor fördel i att de bevarar platsen och ger en möjlighet att kombinera olika datasatser (Gren et al., 2003). Geografiska aggregeringar

32

innebär dock också egna unika utmaningar, som ser olika ut beroende på utformningen av den geografiska aggregeringsmodellen och syftet.

Uttrycket geografiska aggregeringar inbegriper alla sätt som data sammanläggs på en geografisk nivå. Den geografiska nivån kan antingen vara bestämd utifrån en viss yta, som till exempel kvadratkilometer, ett administrativt område eller annan avgränsning som anses relevant. Inom vissa ämnesområden kan den uppdelningen ha naturliga indelningar. Till exempel om en forskare inom geologi ska dela upp områden kan det vara relevant att ha dessa enligt exempelvis jordarter, eller andra geologiska formationer. Problemet är att dessa fenomen aldrig är fördelade med helt klara gränser i verkligheten, och komplexiteten blir än större när det är människor man försöker dela in i fasta geografiska områden. Vilket område tillhör en person? Där individen bor? Hur blir det då om man bor på flera ställen eller spenderar större delen av sin tid utanför bostaden? Och även om en person härleds till platsen för sin bostad, vilket område hör hen ihop med? Vem kan till exempel anses vara hens grannar?

Alla dessa frågor visar på den stora komplexiteten när det att definiera människors levnadsyta och grannskap. Bara vad ordet grannskap innebär, och sedan hur sammanhängande grannskap kan avgränsas är något som har debatterats och forskats på länge. Att det finns något som kan kallas grannskap finns det till stor del en enighet om, men vad det exakt är, är desto svårare att bestämma. I artikeln ”On the Nature of Neighbourhood” (2001) summerar författaren George Galster debatten på följande sätt; “Urban social scientists have treated ‘neighbourhood’ in much the same way as courts of law have treated pornography: as a term that is hard to define precisely, but everyone knows it when they see it.” (Galster, 2001 s 1).

Många geografer har definierat grannskap i ett ekologiskt perspektiv som främst tar hänsyn till den fysiska miljön. Där är det främst naturliga barriärer och gångavstånd som avgör gränserna. Andra forskare har lagt till det sociologiska perspektivet och inkluderar faktorer som sociala interaktioner, relationer och nätverk. Även institutioner och service har använts som avgränsning. Galster lägger samman det ekologiska och sociologiska perspektivet i sin konceptualisering. Han beskriver grannskap som en samling spatialt baserade attribut med kluster av residens, ibland i kombination med andra områden för landanvändning (Galster, 2001). Definitionen av ett grannskap avgörs av var de fysiska gränserna kan sättas, både vad som avgränsar dem och till vilken grad de avgränsas. Till exempel är måttet gångavstånd inte en självklar måttstock, eftersom vad som anses vara inom gångavstånd varierar från individ till individ. Likaså är sociala interaktioner och relationer svåra att anknyta till en avgränsad plats. Vad som sammanför de olika definitionerna och gränssättningarna av grannskap är att de så nära som möjligt försöker spegla verkligheten för de som bor där. Genom att välja olika metoder för gränssättning speglas också olika perspektiv på den verkligheten.

Det är viktigt att reflektera över definitionen av ett grannskap eftersom policy och forskning till så stor del baserar sig på geografiskt indelningar av befolkningen (Martin, Cockings och Leung, 2015). Till exempel är censusdata ett klassiskt underlag för analys och policy som ofta samlas

33

in genom eller aggregeras till statiskt gränsdragna geografiska områden (Openshaw, 1984). Många av de problem som kan uppstå när ett grannskap definieras och avgränsas ryms i akronymen MAUP, Modifiable areal unit problem. MAUP är ett begrepp som belyser hur analysen av data påverkas av gränsdragningen mellan de aggregerade geografiska enheterna. Påverkan av MAUP på analysen är ett problem som närmast alla spatiala analyser behöver förhålla sig till (Fotheringham och Wong, 1991). Hur MAUP uppstår framgår av figuren nedan: de olika områdena representerar olika populationer, och linjerna representerar de administrativa gränserna. Beroende på hur gränserna dras, skapas olika homogena områden. Om sammansättningen av populationen i detalj är känd, så kan de aggregerade områdena ge en missvisande bild av verkligheten (Amcoff, 2012).

Figur 4 The modifiable areal unit problem (MAUP) (figur skapad av författaren)

En av de första geografer som tog upp detta problem var Openshaw (1984) som också namngav begreppet. Han argumenterar i flertal artiklar att statistik kan manipuleras och snedvridas genom den geografiska indelningen som används. MAUP påverkas av två aspekter. Den första är skalan på den geografiska enheten, då analysen påverkas direkt av hur stor enheten är. Den andra aspekten är zoneringen, som Openshaw (1984) kallar aggregeringseffekten (eng.: aggregation effect). Det är denna som beskrivs i figur 4 och visar att det kan bli stora skillnader i resultatet beroende på hur gränsdragning görs (Openshaw, 1984).

I flertal artiklar illustrerar Openshaw hur aggregeringseffekten direkt påverkar resultatet av analysen. Ett tydligt sätt att se hur MAUP verkar är att titta på hur mycket korrelationskoefficienten varierar i samma regression fast på olika geografiska områdesuppdelningar. Taylor och Openshaw (1979) upptäckte att korrelationen mellan republikanska röster och andel äldre i befolkningen i den amerikanska delstaten Iowa kunde variera från -.97 till +.99 beroende på hur kommuner aggregerades. Openshaw och Rao (1995) bevisar tesen igen i en fallstudie i staden Mersyside i England där korrelationen mellan arbetslöshet och hushåll som äger bil kunde gå från att vara maximalt negativ korrelation (-1.00) till att vara maximalt positiv korrelation (+(-1.00) beroende på uppdelningen i geografiska områden.

34

Fotheringham och Wong (1991) utforskar hur MAUP påverkar multivariatanalys. Multivariatanalys är statistiska analyser som behandlar flera variabler åt gången. Deras resultat visar att problemen med MAUP blir större i multivariatanalys eftersom det inte finns någon optimal zonering för alla variabler. Därför är det en stor osäkerhet i all multivariatanalys när datamaterial kommer från aggregerade spatiala zoner. Det målar upp en oroande bild, då stor del av den spatiala analysen forskningen som görs även i dag använder denna typ av aggregerade data (Fotheringham and Wong, 1991).

Geografer har länge arbetat med att åtgärda MAUP och skapa bättre geografiska indelningar (se exempelvis Batty och Sikdar 1982, Openshaw 1987, med flera). Men att hitta en optimal zonering för att bäst approximera individdata är ett enormt komplext projekt. Ett zoneringssystem kan kanske konstrueras för att vara optimalt för en variabel, men är då troligtvis inte det för en annan. (Fotheringham och Wong, 1991) Att kunna skapa en övergripande optimering för variabler i helhet är kanske inte ens möjligt. Som grannskapsforskningen visar är definitionen av grannskap helt olika för olika individer även om det är samma variabler som inräknas. Även om det var möjligt att skapa en perfekt indelning kan det ifrågasättas om en sådan indelning klarar tidens tand. I urbana områden där populationen konstant växer och ändras är det svårt att skapa statiska geografiska zoner som är representativa mer än några år (Amcoff, 2013).

En ytterligare geografisk enhet som används till exempel inom statistik och forskning är enheter skapade efter rutnät. Ett rutnät är en uppdelning av ett geografiskt område i jämt stora kvadratiska ytor. Vanliga enheter är kvadratkilometer eller kvadratmil. En fördel med rutnätsbaserade indelningar jämfört med de oregelbundna spatiala områdesindelningarna är rutnätets stabilitet över tid. Arealbaserade indelningar som skapas efter specifika användningsområden, som exempelvis censusdata, behövs periodiskt revideras för att representera befolkningen (Martin, Cockings och Leung, 2015). Rutnät å andra sidan har en stabil indelning över tid, men baksidan är just att de inte är anpassade efter varken ekologiska eller sociologiska faktorer. Detta gör att de som enheter blir enormt känsliga för problematiken inom MAUP. Som Openshaw (1984) dock framhåller blir problemen mindre ju mindre enheter som används, så finmaskiga rutnät är inte lika känsliga för MAUP:s effekter. Dessa är dock inte långt borta från direkt koordinatnivå på individerna, och då kan man istället ifrågasätta hur väl de slår vakt om integriteten.

MAUP beskriver problematiken i den geografiska skalan, men tar inte upp den temporala som också är en faktor när indelningen av människor görs. Människor rör på sig, och befinner sig i olika delar av staden och rummet vid olika tidpunkter på dagen. Är det då rätt att alltid dela in personer utifrån hemadressen? I artikeln ”Developing a Flexible Framework for Spatiotemporal Population Modeling” (Martin, Cockings och Leung, 2015) lyfts den temporala utgångspunkten upp och problematiseras. Författarna pekar på att konventionell populationskartläggning använder insamlade data som härstammar från eller är associerade med en specifik tidpunkt på

35

dygnet. I majoriteten av fallen antas att individen befinner sig på sin hemadress nattetid. Detta är även fallet för det datamaterial som används i denna analys. I verkligheten finns ingen tid på dygnet då en hel population är hemma, utan detta är i sig en uppskattning (Martin, Cockings and Leung, 2015).

Att det finns olika distributionsmönster för populationer på dagtid respektive nattid har diskuterats av geografer sedan tidiga 1900-talet, men behovet av datamaterial som visar de olika tidsmönstren har blivit allt större. För exempelvis analyser som handlar om resiliens, riskanalyser, tillgänglighet eller trafik är tidsperspektivet av stor vikt. Martin et al utvidgar MAUP-begreppet till att även inkludera den temporala problematiken, i vad författarna kallar

the modifiable spatiotemporal unit problem. Termen användes först av Jaquez (2011) och

beskriver den problematik som uppstår i kombinationen av den spatiala aggregeringen och den temporala aggregeringen. Analyser som är spatialt detaljerade kan ändå vara missvisande när de är temporalt grova. Exempelvis är ett vanligt problem att timmar grovt aggregeras till dag och natt, eller att den temporala aspekten inte tas upp alls i datamaterialet.

Sammanfattningsvis finns det starka empiriska bevis för att MAUP-effekten finns, och dess påverkan sträcker sig över all spatial analys, från traditionella statistiska analyser till spatial interaktionsmodellering och vidare. Om områdesindelningarna görs utefter den specifika variabeln de undersöker kan indelningen bli bättre, men det gör att det blir svårare att sammanlägga olika variabler för multivariabla analyser (Fotheringham och Wong, 1991). Därtill behöver problematiken med den temporala aspekten uppmärksammas i dessa indelningar. Den temporala aspekten kan mildras av att en mer detaljrikedom i den temporala skalan, och detsamma gäller för den areala. Det finns ingen tydlig lösning på MAUP-problemet men en större motståndskraft mot problemen kan nås när data refereras till den minsta möjliga areala enheten (Martin, Cockings och Leung, 2015) (Openshaw, 1984). Därför skulle det optimala sättet att undgå MAUP problematik vara om individen kunde visas på kordinatnivå. Detta är dock som tidigare diskuterat inte möjligt på grund av att den personliga integriteten måste bevaras.

Det finns metoder inom geografin som försöker få bukt med MAUP-problemen genom att aggregera data på ett sätt som utgår från individen istället för ett område.