• No results found

Ett gränssnitt för anonymisering

N/A
N/A
Protected

Academic year: 2021

Share "Ett gränssnitt för anonymisering"

Copied!
43
0
0

Loading.... (view fulltext now)

Full text

(1)

Linköpings universitet | Institutionen för datavetenskap Kandidatuppsatts | Kognitionsvetenskap Vårterminen 2017 |LIU-IDA/KOGVET-G--17/030—SE

Ett gränssnitt för anonymisering

Niklas Blomstrand

Handledare: Henrik Danielsson Examinator: Arne Jönsson

(2)

Upphovsrätt

Detta dokument hålls tillgängligt på Internet – eller dess framtida ersättare – under 25 år från publiceringsdatum under förutsättning att inga extraordinära omständigheter uppstår.

Tillgång till dokumentet innebär tillstånd för var och en att läsa, ladda ner, skriva ut enstaka kopior för enskilt bruk och att använda det oförändrat för ickekommersiell forskning och för undervisning. Överföring av upphovsrätten vid en senare tidpunkt kan inte upphäva detta tillstånd. All annan användning av dokumentet kräver upphovsmannens medgivande. För att garantera äktheten, säkerheten och tillgängligheten finns lösningar av teknisk och administrativ art.

Upphovsmannens ideella rätt innefattar rätt att bli nämnd som upphovsman i den omfattning som god sed kräver vid användning av dokumentet på ovan beskrivna sätt samt skydd mot att dokumentet ändras eller presenteras i sådan form eller i sådant sammanhang som är kränkande för upphovsmannens litterära eller konstnärliga anseende eller egenart.

För ytterligare information om Linköping University Electronic Press se förlagets hemsida

http://www.ep.liu.se/.

Copyright

The publishers will keep this document online on the Internet – or its possible replacement – for a period of 25 years starting from the date of publication barring exceptional circumstances.

The online availability of the document implies permanent permission for anyone to read, to download, or to print out single copies for his/hers own use and to use it unchanged for non-commercial research and educational purpose. Subsequent transfers of copyright cannot revoke this permission. All other uses of the document are conditional upon the consent of the copyright owner. The publisher has taken technical and administrative measures to assure authenticity, security and accessibility.

According to intellectual property law the author has the right to be mentioned when his/her work is accessed as described above and to be protected against infringement.

For additional information about the Linköping University Electronic Press and its procedures for publication and for assurance of document integrity, please refer to its www home page:

http://www.ep.liu.se/.

(3)

Förord

Jag skulle vilja tacka Arbetets museum för ett gott samarbete och för möjligheten att genomföra detta arbete. Jag skulle även vilja tacka Lars Ahrenberg för den handledning jag fått under arbetets gång.

(4)

Sammanfattning

Arbetets museum samlar in personliga berättelser om arbetsliv, dessa berättelser innehåller ofta personlig information om informanten samt dennes kollegor, familj, med mera. Arbetets museum skulle vilja göra dessa berättelser tillgängliga via internet så att allmänheten och forskare skall kunna ta del av dem. För att göra detta måste den personliga informationen tas bort i en anonymiseringsprocess. Detta steg har visat sig vara väldigt tidskrävande. I ett samarbete med Swe-Clarin har Arbetets museum påbörjat arbete med att ta fram ett verktyg för att underlätta denna process. Genom intervjuer har en kravspecifikation om vad ett sådant verktyg behöver innehålla tagits fram. Designlösningar för specificerade krav har utvecklats och utvärderats. Utvärderingarna visade på bättre användarupplevelse i verktyget jämfört med tidigare metoder.

(5)

Innehållsförteckning

1 Inledning ... 1

1.1 Frågeställning ... 3

1.2 Avgränsningar ... 3

2 Teoretisk bakgrund ... 4

2.1 Att kartlägga användares behov ... 7

2.2 Att specificera krav ... 8

2.3 Att producera lösningar ... 10

2.4 Att utvärdera lösningar ... 12

3 Metod ... 16

4 Genomförande ... 17

4.1 Kartläggning av användarens behov ... 17

4.1.1 Tillgängliga data ... 18

4.1.2 Tidskrävande ... 19

4.1.3 Osäkerhet ... 19

4.1.4 Noggrannhet ... 19

4.1.5 Svårt att hitta dokument ... 19

4.1.6 Förbearbetning av analoga data ... 20

4.1.7 Modulär ... 20

4.2 Specificering av krav ... 20

4.2.1 Önskad effekt – Effektiv förberedning av texter med känslig information ... 21

4.2.2 Målgrupp 1 – Vanliga användare ... 22

4.2.3 Målgrupp 2 – Redaktörer ... 24 4.2.4 Målgrupp 3 – Systemadministratör ... 24 4.3 Produktion av lösningar ... 25 4.3.1 Genomgång av prototypen ... 28 4.4 Utvärdering av lösningar ... 30 4.4.1 Resultat av utvärdering ... 30 5 Slutsats ... 33 5.1 Reflektioner ... 34 6 Referenser ... 35

7 Appendix A – Grund för intervju ... 37

(6)

1

1 Inledning

Arbetets museum har samlat in personliga berättelser om arbete och vardagsliv sedan 1991. Insamlingarna innehåller ofta intervjuer och fotodokumentation men även anteckningar från fältarbete (Arbetets museum, 2017). Delar av det insamlade materialet ges ut i skrifter och publikationer men det är långt ifrån allt som görs tillgängligt på detta vis. Det händer att forskare hör av sig till Arbetets museum för att ta del av något av det insamlade material som ännu inte tillgängliggjorts. På grund av att många författare av berättelserna inte givit samtycke för hur deras material och personuppgifter får behandlas har Arbetets museum i enlighet med personuppgiftslagen anonymiserat texterna i dessa fall. Anonymiseringen utav texterna har skett genom att en arkivarie gått igenom texten i ett ordbehandlingsprogram så som Microsoft Wordoch redigerat sådant som kan användas för att identifiera en person. Detta har visat sig vara en tidskrävande process och det är lätt att missa potentiellt känsliga ord.

Nu planerar Arbetets museum att tillgängliggöra hela sin dokumentsamling av personliga berättelser så att forskare och allmänheten skall kunna ta del av den. De skulle vilja att berättelserna går att nå via deras webbsajt där man skall kunna söka efter ord och begrepp för att få fram relevanta texter. Innan detta är möjligt måste de se till att de antingen har samtycke från författarna, eller att de texter som publiceras på nätet inte innehåller någon information som kan användas för att identifiera en person. Arbetets museum har valt att anonymisera samtliga texter och sedan våren 2016 samarbetar de med Swe-Clarin, den svenska grenen i ESFRI-initiativet CLARIN (Common Language Resources and Technology Infrastructure) för att ta fram ett verktyg som skall underlätta processen.

Tidigt i samarbetet fanns en önskan från Arbetets museum att ta fram ett verktyg som automatiskt genomförde anonymisering av dokumenten. Swe-Clarin har dock avrått från detta tillvägagångssätt då de språkteknologiska metoder (ordklasstaggning, namnigenkänning, referentbestämning) som behövs för denna typ av verktyg inte presterar tillräckligt bra i dagsläget (Dias, Mamede, & Baptista, 2016). I ett läge där ett eller ett par missade ord kan innebära lagbrott måste det finnas någon sorts garanti på att samtlig känslig information är redigerad. För att Arbetets museum skall kunna vara helt säker på att de dokument som publiceras inte bryter mot personuppgiftslagen har Swe-Clarin föreslagit att verktyget bör vara halvautomatiskt. Ett sådant verktyg skulle guida användaren i anonymiseringsprocessen och ge förslag på känslig information att redigera. Det skulle också innehålla en kvalitetskontroll där texten granskas innan publicering. Denna typ av verktyg har visat sig fungera tidigare. Povlsen,

(7)

2

Jongejan, Hansen och Simonsen presenterade förra året ett system som användes för anonymisering av domslut (2016). Deras verktyg förlitar sig på regler för att hitta potentiellt känslig information i texten och presenterar de funna ordern och fraserna för användaren som beslutar om hur de skall åtgärdas. I augusti 2016 presenterade Swe-Clarin en grov prototyp av ett halvautomatiskt verktyg på Arbetets museum för att de skulle få en bild av hur en färdig version skulle kunna se ut. Utöver detta har Swe-Clarin givit förslag på ett arbetsflöde för tillgängliggörande av texter baserat på den mjukvaruarkitektur som presenterats av Vico och Calegari (2015). Hela flödet presenteras nedan i Figur 1.

Figur 1: Swe-Clarins förslag på arbetsflöde för tillgängliggörande av dokument

Hittills har arbetet med verktyget till stor del fokuserat på de språkteknologiska metoder som verktyget är tänkt att använda sig utav. Överlag är dessa metoder i fokus när anonymiseringsverktyg presenteras och diskuteras. För systemet som nämndes ovan presenteras exempelvis hur de algoritmer som används tagits fram och fungerar. Det är sällan fokus på hur verktyget ser ut, vilken funktionalitet det innehåller eller varför det har just denna funktionalitet. Detta gör det svårt att få reda på vad det är som är viktigt för användaren av ett sådant verktyg. Vad behöver en användare egentligen för att kunna utföra anonymisering på ett snabbt och effektivt sätt? Denna typ av frågor är viktiga för Arbetets museum, de har ingen större nytta av att veta hur algoritmerna fungerar. Däremot behöver de veta vad det är som gör att verktyget blir lätt att arbeta med och inte stör anonymiseringsprocessen. Detta för att kunna utveckla ett verktyg som hjälper dem att tillgängliggöra sin dokumentsamling på ett effektivt

(8)

3

sätt. Målet med denna studie är därför att ta reda på vilken funktionalitet användarna behöver och testa olika designlösningar. Arbetet leder till insikter om vad fungerar bra och vad som fungerar sämre. Dessa insikter kan sedan användas i utvecklingen av verktyget för att i slutändan se till att processen med att tillgängliggöra dokumentsamlingen blir så effektiv som möjligt.

1.1 Frågeställning

Frågeställningarna för detta arbete är:

• Vilken funktionalitet behöver ett verktyg för tillgängliggörande av texter med känslig information innehålla?

• Hur kan funktionerna implementeras?

1.2 Avgränsningar

För att hålla detta arbete inom den angivna tidsramen kommer endast designlösningar för själva anonymiseringsprocessen att tas fram och testas. Designlösningar för annan funktionalitet som kan behövas i ett verktyg för tillgängliggörande av texter kommer inte utvecklas eller testas.

(9)

4

2 Teoretisk bakgrund

Detta avsnitt beskriver den teori som ligger till grund för de metoder och angreppssätt som använts i studien.

2.1 Användarcentrerad design

Ottersten och Balic (2004) skriver att det sätt som vi ofta utvecklar och inför IT-produkter på skapar problem. Problem som till exempel förseningar, ökade kostnader eller att produkten inte har den förväntade effekten skulle kunna gå att undvika om man använde en annan metod. En av orsakerna till dessa problem beror på att de modeller som används för att göra nyttokalkyler för IT-investeringar, som exempelvis PENG (Dahlgren, Lundgren, & Stigberg, 1997), inte grundar sig i användningsmönster, behov eller förväntningar. Kalkylerna och besluten som följer bygger därför ofta på förhoppningar och antaganden och kan leda till en felaktig och alltför positiv bild av de förväntade effekterna. Nyttokalkyler har dessutom ett smalt användningsområde, de kan till exempel inte användas för att styra projektet när det väl startar eftersom de inte ger någon information om vilka egenskaper produkten bör ha. Vidare skriver Ottersten och Balic (2004) att när projektet dragit igång blir fokus ofta på att skapa produkten, inte vilka effekter den skall få. Målen blir exempelvis att producera kod, klara leveranser och hålla sig till budget. Istället bör fokus ligga på att skapa en produkt som uppnår önskad effekt (Ottersten & Balic, 2004). De beskriver olika orsaker som kan ligga till grund för detta felaktiga fokus. Den huvudsakliga orsaken är att det inte finns ett specificerat effektmål eller att det är alltför otydligt. Effektmål som att ’produkten skall vara lätt att arbeta med’ är alltför otydliga. Vad innebär ’lätt’? Det finns utrymme för många tolkningar och många olika lösningar, lösningar som man inte vet leder mot önskad effekt eller ej. Detta hänger ihop med att en annan orsak, kraven på produkten baseras ofta på subjektiva tyckanden från beställare eller användare. Metoder för att skaffa sig strukturerade och utvärderade förväntningar på effekter används lite eller inte alls. För att undvika dessa problem förslår Ottersten och Balic (2004) att man använder sig av effektstyrning.

Effektstyrning handlar om att styra ett projekt mot ett önskat mål eller syfte. Ottersten och Balic (2004) skriver att effektstyrning innebär följande:

• Att man skall utgå från de effekter som produkten eller systemet skall skapa för beställare och användare. Detta skall ske med strukturerade metoder och inte baseras på subjektiva åsikter. Förslag på metoder är effektkarta och målgruppsanalys.

(10)

5

• Att lösningar tas fram med tydliga kopplingar till de avsedda effekterna. Det skall även specificeras tydligt nog för att både beställare och leverantör har samma bild av hur systemet skall se ut.

• Lösningsförslagen skall testas med hjälp av användningstest i realistiska miljöer. • Slutligen skall systemet justeras utifrån resultatet från användningstesten.

Enligt Ottersten och Balic (2004) uppstår effekterna av ett IT system när det används. För att kunna styra projektet mot dessa effekter måste de först och främst vara tydliga. Effekterna uppstår genom att tillgodose användaren behov och förväntningar. Genom att använda strukturerade metoder tar man reda på vad dessa behov och förväntningar är och med denna information kan man sedan styra projektet mot de önskade effekterna. (Ottersten & Balic, 2004)

Denna beskrivning av vad effektstyrning innebär har många likheter med design-ansatsen användarcentrerad design. Enligt ISO 9241–210 (2010) definieras användarcentrerad design som en iterativ process, den illustreras i Figur 2 nedan.

Figur 2: Illustrering av den iterativa processen i användarcentrerad design

Processen består av ett första planeringssteg för att sedan gå in i en iterationscykel som börjar med att skaffa sig information om användarsituationen. Den insamlade informationen specificeras sedan i krav, varefter olika lösningar för att nå dessa produceras. I Sista steget utvärderas lösningarna mot kraven. Om något inte fungerar som det är tänkt börjar man om och

(11)

6

skaffar sig mer information, omarbetar kravbilden (vid behov) och tar fram nya designlösningar som sedan utvärderas på nytt. Användarcentrerad design kan appliceras på mer än bara IT-produkter men själva kärnan i ansatsen är att utgå från användarens perspektiv. Varför är då detta så viktigt? Som nämnts tidigare så skriver Ottersten och Balic (2004) att det är viktigt för att undvika att ta beslut som är baserade på subjektiva tyckanden och antaganden. Med hjälp av strukturerade metoder får man en grund för de designbeslut som tas. Förespråkare för användarcentrerad design skriver också om detta som en huvudsaklig anledning att utgå från användarens perspektiv. Med hjälp av insamlad information om vem som skall använda produkten eller om situationen den skall användas i, kan designers dra slutsatser om vilka lösningar som hjälper de framtida användarna nå sina mål på bästa sätt. Arvola (2014) menar att informationen om brukssituationen leder till en ökad chans att produkten tas i bruk. Enligt honom är det just i tillfället när produkten används som den blir värdefull och skapar värde för användarna. Om den aldrig kommer till användning har arbetet med att ta fram produkten varit bortkastat (Arvola, 2014). Just därför är det viktigt att ta reda på vad användarna verkligen behöver och hur deras situation ser ut. Goodwin (2009) skriver att en lyckad design hjälper människor att uppnå syfte ett på ett effektivt, säkert och tilltalande sätt. Genom att studera brukssituationen och prata med användaren kan man ta reda på vad som är effektivt, säkert och tilltalande för dem och på så vis skapa en lyckad design.

Att ta reda på användarens behov och förväntningar är alltså viktigt. Det skall dock nämnas att detta inte är samma sak som att låta användare ta designbeslut. Ottersten och Balic (2004) skriver att det har blivit vanligare att överlåta design av lösningen till användarna. Man har märkt att IT-produkter som inte accepteras av användare ger dålig effekt eller inte används alls. Som lösning har man därför låtit användare få ta beslut om hur produkten skall se ut och bete sig. Detta är en felaktig lösning menar Ottersten och Balic (2004), de skriver att design av IT-lösningar är något som slutanvändare skall syssla med lika lite som bilförare skall detaljplanera en ombyggnad av Kungens kurva. Både bilförare såväl som användare har erfarenheter som gör att de kan peka ut vanliga problem men de saknar centrala insikter om hur man specificerar en lösning. Vidare skriver de att detta är ett kostsamt sätt att bedriva IT-utveckling på. Det tar tid från användarna och lösningarna kommer att baseras på vad ett fåtal användare känner till och kan utrycka. Det saknas lösningar baserade på bakomliggande behov, attityder och värderingar som kan vara svåra att artikulera. De skriver dock att resultatet kan bli bra men överlag är riskerna med detta sätt att genomföra design alltför stora. De ser hellre att design genomförs på ett strukturerat sätt genom att kartlägga användarens behov.

(12)

7

2.2 Att kartlägga användares behov

Att samla information om användarna och skaffa sig en uppfattning om deras situation kan göras på flera olika sätt. Arvola (2014) skriver att förutom att man behöver genomföra efterforskningar och ha empati kan grunderna för att skaffa sig denna uppfattning summeras i tre punkter: (1) Träffa dina användare; (2) prata med dem; (3) skriv ner vad du sett och hört. När man träffar sina användare är det en god idé att passa på att titta på vad de gör. Enligt Howitt (2010) är observation ett sätt att skaffa sig information om hur produkter används i en vardaglig situation. Det finns ofta ett glapp mellan vad folk säger att de gör och vad de faktiskt gör, att observera och anteckna är ett sätt att minska detta glapp (Howitt, 2010). Pratar man med sina användare bör man även försöka ta reda på så mycket som möjligt om deras användarsituation. Detta görs lättast genom att dyka upp förberedd med intervjufrågor. Intervjuer är en flexibel metod som kan genomföras med en eller flera personer, på så vis kan man få synpunkter från flera användare på samma gång (Howitt, 2010). Goodwin (2009) skriver att när man tar fram frågor inför en intervju skall man se till att försöka håller de så öppna som möjligt så att intervjupersonen kan prata fritt. Det blir då lättare att komma åt information och få mer användbara svar. Hon skriver dock att den som intervjuar kan ha med ett antal stängda frågor att använda i slutet av intervjun utifall svar på tidigare frågor inte täcker något man är särskilt intresserad av. Arvola (2014) listar fem fokuspunkter, skrivna som frågeord, tänkta att fånga olika aspekter av en användningssituation. De är Vem, Vad, När och Var, Hur, Varför. För varje fokuspunkt har han även skrivit ner förslag på frågor som kan användas under datainsamling för att fånga relevant information. Frågor under fokuspunkten ’Vem’ handlar om vem användaren är, vilken roll denne har, hur gammal är användaren, utbildningsnivå, kön med mera. Fokuspunkten ’Vad’ innefattar vad användaren gör, vilka saker är viktiga för användaren, hur ofta eller hur länge görs det. ’När och var’ syftar på i vilka sammanhang produkten skulle kunna tänkas användas men även var användaren vanligtvis befinner sig, var bor användaren eller hur ser en vanlig dag ut? ’Hur’ fokuserar på hur användaren går tillväga när de utför en uppgift, vilka handlingar ingår, vad fungerar bra och vad fungerar sämre? Den sista fokuspunkten, ’Varför’, beror användarens motivation, vad anser användaren vara lyckat, finns det målkonflikter? Dessa fokuspunkter och de frågor de innehåller menar Arvola kan ge en bra grund till de saker man behöver täcka in när man samlar information om sina användare och deras situation. Fokuspunkterna kan användas när man skapar intervjufrågor men även som en bakgrund till vad man tittar efter under en observation och som påminnelse över vad som skall täckas in under analys (Arvola, 2014).

(13)

8

Goodwin (2009) skriver också om att använda enkäter för att samla in data. Det kan vara en bra metod för att samla in data om en population efter det att den kvalitativa datan exempelvis har avslöjat ett visst beteende som kräver en specifik åtgärd. I dessa fall kan det vara bra att ta reda på hur stor del av populationen som följer samma beteendemönster eller tycker likadant. Hade man endast förlitat sig på den kvalitativa datan från intervjuer eller observationer kanske man löser ett problem eller tillverkar en produkt som har en väldigt smal målgrupp och på så vis slösas värdefulla resurser.

2.3 Att specificera krav

I det andra steget i design-cykeln analyseras den insamlade information och specificeras i krav. Syftet med analysen är att få en bättre förståelse av den data som samlats in så att man kan resonera om vilka lösningar som passar för användningssituationen. Goodwin (2009) gör en liknelse mellan data-analys och bakning. Att försöka använda insamlade data som de är, utan analys, skulle vara som att äta ingredienserna till en kaka var och en för sig, det är onödigt jobbigt och otrevligt. Hon skriver att en bra analys, precis som bakning, förvandlar ingredienserna till något mer välsmakande och lättsmält. Analysprocessen går ut på att förstå det man hört och observerat och komprimera datan till något mer hanterligt samt att hitta mönster och relationer. När detta har funnits görs även tolkningar av vad mönstren och relationerna innebär (Goodwin, 2009). En vanlig metod att använda för detta analyssteg är Affinitetsdiagram (Goodwin, 2009). Det är en induktiv ansats som går ut på att gruppera utdrag, idéer eller observerade beteenden från den insamlade datan som upplevs höra ihop (Arvola, 2014; Goodwin, 2009). Arvola (2014) beskriver hur man tar fram ett affinitetsdiagram på följande vis: Det görs ofta i grupp där varje medlem i design-teamet skriver ner saker de tycker är viktiga från den insamlade datan på post-it lappar som sedan sätts upp på en tavla eller vägg. Lapparna flyttas sedan runt och lappar som upplevs likna varandra eller höra ihop flyttas ihop i grupper. Detta håller på tills alla gruppmedlemmar är nöjda och inte vill göra fler förflyttningar. Som nämndes ovan skall analysen komma fram till vad det finns för relationer eller mönster i datan. Nu när datan är kategoriserad kan det vara lättare att hitta mönster och upptäcka relationer. Designgruppen försöker gemensamt komma fram till vad det är som binder grupperna samman, det kan vara så att vissa grupper får stå själva eftersom de inte hänger ihop med andra. Det som binder en grupp samman kan sen användas för att namnge den, ofta används en kort fras. Som sista steg kan linjer ritas ut mellan kategorier för att representera hur de hänger ihop och vilken relation de har. Goodwin (2009) påpekar att det inte är själva diagrammet som är syftet med denna uppgift utan de insikter man får när man arbetar med

(14)

9

datan. Även Arvola (2014) påpekar att analysen inte stannar här, man måste också fråga sig vad datan innebär. Finns det något som var överraskande, vad vet vi nu som vi inte visste tidigare, är det något i datan som får oss att se saker på ett nytt sätt? Denna typ av frågor menar Arvola kan leda till att man får ut så mycket som möjligt av affinitetsdiagrammet. Med information om vad folk kan, hur de känner skapas ofta en persona. En persona är en typisk användare för ett visst användningsmönster och kan användas för att en designgrupp skall få en enhetlig bild över vilka deras användare är (Arvola, 2014; Goodwin, 2009). Personor kommer ofta till liv i scenarier där det beskrivs hur de skulle lösa en för den målgruppen typisk uppgift eller agera i ett visst sammanhang. Detta hjälper designers att se hur den framtida produkten kan komma att användas (Goodwin, 2009). När man nu vet vilka användarna är, hur de agerar och vad de tycker kan man specificera vad själva produkten skall uppnå, vilken effekt skall den ha? Här förespråkar Ottersten och Balic (2004) att man skapar en effektkarta. Effektkartan försöker besvara, (1) varför systemet skall tas fram, (2) vilken målgrupp som kan skapa de önskade effekterna med systemet, (3) vad dessa målgrupper behöver för att uppnå dessa effekter och (4) hur systemet skall utformas. Effektkartan innehåller även en eller flera mätpunkter som används för att säkerställa att de önskade effekterna uppnås (Ottersten & Balic, 2004). De skriver att liknande information som effektkartan innehåller tas fram idag men att den är utspridd i många olika dokument och det kan vara svårt att se hur de åtgärder som föreslås hänger samman med önskade effekter. En av fördelarna med effektkartan är att samla all information på samma plats. Effektkartan är också tänkt att användas under hela projektets gång för att styra motönskad effekt samt bidra med en grund inför designarbetet. Ottersten & Balic (2004) illustrerar effektkartan som ett träd med syftet som rot och målgrupper, deras behov och hur de skall uppnås som noder i trädet. Figur 3 nedan visar hur detta träd ser ut.

(15)

10

Figur 3: Illustrering av en effektkarta

Även Arvola (2014) skriver att man bör beskriva syftet med varför man genomför designarbetet med vilka effekter som förväntas. När man har dessa effekter klara för sig och har fyllt i sin effektkarta går man in i det tredje steget i iterationscykeln, att producera lösningar.

2.4 Att producera lösningar

Det är sällan det endast finns en lösning på hur en funktion skall utformas, hur många som bidrar till den förväntade nyttan är dock färre. Det gäller därför att testa många olika lösningar som är grundade i de insikter man fått från data-analysen. (Ottersten & Balic, 2004) Att skissa sina tänkta lösningar på papper är viktigt för att få dem att utvecklas eftersom det är lättare att förstå något man kan se (Goodwin, 2009). Arvola (2004) skriver att det är viktigt att försöka generera många idéer och på varje skiss värdera med plus och minuslistor vad som är bra och vad som är dåligt.

Hur gör man då när man skissar på lösningar? För gränssnitt i IT-system finns det en rad principer för design att utgå ifrån. En av de mest grundläggande principerna är den om handlingsinviter. Arvola (2004) skriver att handlingsinviter används för att visa vilka typer av handlingar som är möjliga. En vanlig tillämpning av detta är att göra knappar som man inte kan klicka på gråa eller liknande färg som bakgrunden så att de inte märks och knappar som går att klicka på får en mer tydlig färg så att de syns. Handlingsinviter är, inte förvånande, lättare att hitta om man vet vad man skall leta efter. Vad vi letar efter och tror att vi kan göra är i stor del beroende på våra mentala modeller, alltså vilka föreställningar vi har om världen (Arvola, 2014). En designer kan använda sig av detta om det finns en förståelse för användarens mentala

(16)

11

modell, på så vis kan systemet innehålla sådant som motsvaras av något i användarens begreppsvärld (Arvola, 2014). Detta kan till exempel införas med hjälp av metaforer. Ett exempel på hur metaforer används är hur man ser datorn som ett skrivbord med mappar som man placerar dokument i. Denna metafor underlättade enligt Arvola (2004) för de första användarna av datorer eftersom de använde sig av samma termer och sätt att arbeta i datorn som utanför. Det finns även principer för gränssnittsdesign som berör användarens uppmärksamhet. Ibland uppmärksammar vi fel saker och missar det som är viktigast (Arvola, 2014). För att se till att det som är viktigt hamnar i fokus kan man göra det lättare att upptäcka. Det finns flera sätt att göra detta på, till exempel kan man göra så att det som är viktigt sticker ut mer från kringliggande objekt. En annan vanlig lösning är att utnyttja en annan sensorisk modalitet i designen, exempelvis spela upp ett ljud i en i ett annars visuellt gränssnitt (Wickens, Hollands, Banury, & Parasuraman, 2013). Om något i ett gränssnitt skall gå att klicka på måste det vara lätt att pricka. Fitts lag (Fitts, 1954) menar att tiden för att pricka ett mål beror både på avståndet till målet samt dess storlek. Arvola (2014) förklarar vad detta har för effekter för design. Kort sagt så innebär det att saker man kan klicka på bör ha en rimlig storlek. Det innebär också att kanter och hörn på skärmen blir extra effektiva eftersom det är lätt att föra muspekaren dit snabbt. Slutligen nämner Arvola att det även innebär att saker som finns nära det som användaren arbetar med går att nå snabbt. Hur många saker det finns att välja mellan har också en påverkan på hur lång tid det tar att göra ett val. Hick-Hymans lag beskriver just detta fenomen (Hick, 1952; Hyman, 1953). För en designer innebär detta att gränssnittet inte bör innehålla onödiga valmöjligheter (Arvola, 2014).

När man skaffat sig skisser på hur gränssnittet skapas prototyper som sedan används för att utvärdera lösningarna. Att arbeta med prototyper säkerställer att man kan testa viss funktionalitet och inte lägga resurser på att ta fram ett system som sedan visar sig inte fungera (Arvola, 2014). Arvola (2004) förespråkar att de första prototyperna som tas fram är så kallade pappersprototyper, alltså en version av systemet skapade av papper och kartong. Den blir interaktiv genom att någon låtsas vara dator och ger användaren korrekt återkoppling (byter ’skärmbild’) när denne pekar på skärmen. Enligt Arvola så är det huvudsakligen systemets flöde, övergripande koncept och hur lätt den är att förstå som testas med hjälp av pappersprototyper (Arvola, 2014). Vill man testa effektivitet, utseende och känsla bör man bygga en så kallad datorprototyp (Arvola, 2014). Dessa typer av prototyper är mer lika den slutgiltiga produkten än en pappersprototyp. Man skall dock akta sig att göra en prototyp alltför lik den slutgiltiga versionen, om den ser ofärdig ut finns det större chans att man får förslag på

(17)

12

förbättring (Arvola, 2014). En datorprototyp kan tas fram på flera olika vis, man kan skapa en så kallad evolutionär prototyp som är tänkt att bli det färdiga systemet efter några iterationer i designcykeln eller så kan man göra snabba prototyper i program som till exempel Interface Builder, Visual Studio Express eller Axure som sedan kastas bort efter testning (Arvola, 2014).

2.5 Att utvärdera lösningar

Att utvärdera lösningar handlar om att skaffa sig en uppfattning om användarupplevelsen för att försöka förbättra designen. Användarupplevelsen innefattar användarens interaktion med systemet såväl som tankar, känslor och uppfattningar som resulterar från interaktionen. Användarupplevelsen säger något om handlingskraft (att kunna utföra en uppgift), effektiviteten (hur svårt det är att utföra uppgiften) och tillfredsställelse (till vilken grad användaren var nöjd med sin upplevelse i att utföra uppgiften). (Tullis & Albert, 2013) Det finns många sätt att mäta och samla in data om användarupplevelsen på. Tullis & Albert (2013) skriver att den vanligaste metoden för att samla data om användarupplevelsen är genom lab-test med relativt få (5-10) deltagare. I ett lab-lab-test finns en lab-testledare som ställer frågor till deltagaren och ger dem uppgifter att utföra i det system som skall testas. Ofta ombeds deltagaren att utrycka sina tankar högt, så kallat tänka-högt test (Arvola, 2014), så att testledaren och potentiella observatörer kan få reda på hur användaren resonerar kring de olika designlösningarna. De skriver också att denna typ av test är vanligast i en iterativ designprocess där syftet är att förbättra ett system under utveckling. Det är också möjligt att genomföra lab-test online för att nå flera deltagare samtidigt, då finns istället skrivna instruktioner till deltagarna som de följer på skärmen. Detta är ett bra sätt att samla mycket data men ger ofta mindre insikt i hur användaren tänker (Tullis & Albert, 2013). Även online-enkäter används ofta i användbarhetsstudier och kan vara ett snabbt sätt att få återkoppling på exempelvis utseende och layout men saknar interaktionen hos ett lab-test. Användbarhetsmått delas in i problembaserade mått, självrapporterade mått samt beteende och fysiologiska mått (ibid).

För att använda problembaserade mått krävs ofta att man först identifierat ett problem, de är alltså lämpliga att använda i andra eller tredje vändan i designcykeln. De kan dock upptäckas under tiden som ett test sker, särskilt om användaren utrycker sina tankar när de utför en uppgift och stöter på problem. (Tullis & Albert, 2013) De problembaserade måtten innefattar bedömningar av hur allvarliga funna problem är, hur många unika problem som upptäcks, hur många användare som upptäcker problem samt vilka typer av problem som upptäcks (Tullis & Albert, 2013).

(18)

13

Självrapporterade mått ger mycket information om användarens upplevelse av systemet. Det vanligaste sättet att samla självrapporterade data är med hjälp av någon sorts bedömningsskala, exempelvis Likert-skala eller semantisk differentialskala (Tullis & Albert, 2013). Likert-skalan består av påståenden där användarna fyller i till vilken utsträckning de håller med om varje påstående. Ofta används en femgradig skala där 1 är ”Instämmer inte alls” och 5 är ”Instämmer fullt”. En semantisk differentialskala är liknande men innehåller istället par av motsatta adjektiv. Användaren fyller då i på en skala vilka av dessa adjektiv som bäst överensstämmer med deras upplevelse, även här används ofta en femgradig skala. Tullis och Albert (2013) skriver att en av de vanligaste användningarna av självrapporterade mått är att mäta den allmänna uppfattningen av ett system efter att användarna är färdig med samtliga uppgifter. Vidare skriver de att detta också ofta används för att jämföra två system. Ett av de vanligaste verktygen för att göra denna typ av jämförelse är en SUS-enkäten (System Usability Scale). Denna enkät är en fem-gradig Likert-skala som innehåller 10 påståenden där hälften har en positiv formulering och hälften har en negativ formulering. Svaren i en SUS-enkäten används för att räkna fram ett värde mellan 0 och 100 som kan användas för att bedöma användbarheten hos ett system. För att beräkna SUS-värdet summeras värdet för varje påstående, värdet sträcker sig från 0 – 4. För udda påståenden beräknas värdet genom att ta positionen i Likert-skalan minus 1. För jämna påståenden är värdet 5 minus positionen. Summan av dessa värden multipliceras med 2.5. Se figur 4 nedan för exempel.

(19)

14

Figur 4: Exempel på beräkning av SUS-värde. I kolumnen längst till höger visas beräkning av värde för varje påstående. Under enkäten visas beräkning av slutgiltligt SUS-värde.

Tack vare att SUS-enkäten har använts i stor utsträckning har Bangor, Kortum och Miller (2009) kunnat samla data från 206 studier som använt SUS-enkäter och kommit fram till följande riktlinjer när man tolkar sina SUS-värden:

• Värde < 50: Oacceptabelt • Värde 50-70: På gränsen • Värde > 70: Acceptabelt

(20)

15

Beteende och fysiologiska mått försöker fånga sådant som användaren utrycker spontant, ögonrörelser, emotionellt engagemang och stress (Tullis & Albert, 2013). För att mäta spontana utryck är det lättast om man spelar in ett test, gärna en videoinspelning. Uttrycken kategoriseras sen efter hur positiva eller negativa de var och kan ge en uppskattning om hur användaren känner om en viss designlösning (Tullis & Albert, 2013). Ögonrörelsemätningar kan ge viktig information om vad användaren lägger märke till i ett system. Det kan också användas för att mäta hur länge en användare tittar på ett visst område, hur många gånger man tittar där eller i vilken ordning man tittar på olika element i gränssnittet (Tullis & Albert, 2013). För att mäta emotionellt engagemang används ofta sensorer som mäter den elektroniska konduktansen i handflatorna (ibid). Konduktansen ökar när vi är svettiga, något som påverkas av det sympatiska nervsystemet, detta kan vara en indikation på ökat emotionellt engagemang. Även pulsvariation kan användas för att säga något om emotionellt engagemang samt stress. (ibid)

För att över huvud taget kunna utvärdera en design krävs deltagare som kan testa och ge sina synpunkter, men hur många deltagare är tillräckligt? I början av avsnittet skrevs att 5-10 deltagare är vanligt i ett labb-test där testning genomförs på plats med testledare. Tullis och Albert (2013) skriver att det generellt sett finns två läger i debatten om hur många deltagare en användbarhetstudie bör ha. Det ena lägret hävdar att 80% av alla användbarhetsproblem upptäcks med de fem första deltagarna, något som kommit att refereras som ’det magiska numret 5’. Det andra lägret å andra sidan menar att fem deltagare inte är tillräckligt, de har inte funnit belägg för att 80% av alla användbarhetsproblem upptäcks tidigt. På grund av oklarheten med hur många deltagare som behövs rekommenderar Tullis och Albert (2013) att man bör vara flexibel. De skriver att det kan fungera att genomföra användbarhetstester med 5-10 deltagare om; (a) det är ok att missa några användbarhetsproblem, om du exempelvis vill fånga in stora problem, göra en ny version och testa på nytt; (b) det endast finns en användargrupp som du tror kommer ha liknande åsikter och utföra uppgifterna på ett liknande sätt; (c) designen är begränsad, alltså att det finns få uppgifter eller lösningar att testa.

(21)

16

3 Metod

I detta avsnitt presenteras och motiveras de metoder som använts i studien.

I avsnitt 2.2 nämndes att design-processen börjar med att inhämta information om användarsituationen. I detta arbete valdes intervju som huvudsaklig metod för att samla in denna data. En annan vanlig metod i detta skede, observation av nuvarande processer (Goodwin, 2009), kunde dessvärre inte genomföras då användarna idag inte tillgängliggör dokument i sitt vardagliga arbete. Att samla in data via enkäter valdes också bort i detta skede eftersom det inte fanns något att utgå ifrån för att skapa enkät-frågor. Det fanns heller inte tillgång till en tillräckligt stor användargrupp för att samla kvalitativa data.

För att analysera den insamlade intervju-datan skapades ett affinitetsdiagram. Denna metod valdes eftersom den är enkel att genomföra och ger en bra grundläggande förståelse av användarsituationen. I avsnitt 2.3 beskrevs även att det inte räcker med att skapa ett affinitetsdiagram, analysen måste ta ett extra steg. Ofta skapas en persona med hjälp av information från affinitetsdiagrammet men här valdes att inte använda denna metod. Anledningen är att, som nämndes i avsnitt 2.2, personas används för att en designgrupp skall få en enhetlig bild över vilka deras användare är. I detta fall genomfördes designen av endast en person och därför ansågs inte personas vara nödvändiga i designprocessen. Affinitetsdiagrammet följdes upp med en effektkarta, i denna ingår en beskrivning av vilken målgrupp som kan skapa de önskade effekterna och hur detta skall gå till. Denna beskrivning av de olika målgrupperna innehåller mycket av den information som hade funnits i en persona även om den inte kommer till liv på samma sätt i ett scenario och får namn, bakgrundsinformation med mera. Effektkartan valdes just för att den dels fungerar som en kravspecifikation på hur de önskade effekterna skall nås samtidigt som den finns som stöd i designarbetet. På så vis hjälper den till att besvara studiens båda frågeställningar. I designprocessen blir effektkartan ett resultat av det andra steget i designcykeln, den är en syntes av den insamlade datan, specificerat i krav och lösningar.

Nästa steg i designprocessen handlar om att ta fram lösningar med mål att uppnå den önskade effekten. De framtagna lösningarna skall också kunna testas med användare. För att genomföra detta användes skissning och prototyper. Dessa metoder valdes för att de möjliggör snabb utvärdering av flera olika designlösningar (Arvola, 2014). Prototypen som togs fram var en digital prototyp. Anledningen till att inga pappersprototyper skapades var att designlösningarna

(22)

17

var tänkta att utvärderas gentemot ett existerande system. Detta antogs bli problematiskt med en pappersprototyp då uppgifterna som skall genomföras i användartestet ansågs vara opassande i detta medium.

För att utvärdera prototypen innehållande de designlösningar som tagits fram genomfördes ett användartest där deltagare fick genomföra en uppgift, en gång med hjälp av prototypen och en gång med hjälp av annan mjukvara. För att samla data om användarupplevelsen fick användes en SUS-enkät som deltagarna fyllde i efter varje avklarad uppgift. SUS-enkäten användes eftersom den är vanlig vid jämförelser av två lösningar eller system.

4 Genomförande

I detta avsnitt presenteras hur hela studien gått till i kronologisk ordning från insamling av data till utvärdering av designlösningar.

4.1 Kartläggning av användarens behov

Som förstudie genomfördes intervjuer med potentiella användare av systemet. Arkivarier från museer i Östergötland intervjuades i semistrukturerade intervjuer. Syftet med intervjuerna var att få en förståelse för hur användarna såg på tillgängliggörande och anonymisering av dokument. Intervjuerna skedde på respektive museum och deltagarna gav informerat samtycke innan intervjun började. Som grund för intervjuerna användes frågorna i Appendix A, de är framtagna med hjälp av de fokuspunkter för användarstudier som presenterats i avsnitt 2.2. Efter varje intervju renskrevs de anteckningar som tagits under intervjun, även egna tankar och kommentarer kring vad som sagts skrevs ner. Som del av förstudien sammanställdes även mötesanteckningar från projektmöten mellan Swe-Clarin och Arbetets museum under 2016 för att för att användas i vidare analys. Denna data ger insikt i vad det finns för begränsningar och krav från utvecklarens perspektiv för ett verktyg för tillgängliggörande av data samt ytterligare information om övergripande mål med projektet.

Analys av samtliga insamlade data genomfördes med hjälp av ett affinitetsdiagram. De ämnen som ansågs viktiga skrevs ner på lappar och lades ut på ett bord. Efter att ha gått igenom anteckningarna ett flertal gånger och säkerställt att inga viktiga delar missats började processen med att föra samman lappar som liknade varandra i grupper. Även detta gjordes i flera iterationer för att se till att inget utelämnats. När grupperingen var färdig namngavs varje grupp och relationerna mellan grupper skrevs ner. Nedan följer en förklaring av kategorierna och hur de relaterar till varandra, hela affinitetsdiagrammet presenteras nedan i Figur 5.

(23)

18

Figur 5: Grafisk illustration av affinitetsdiagrammets kategorier

4.1.1 Tillgängliga data

Tillgängliga data är den mest centrala kategorin och presenteras därför högts upp. Att tillgängliggöra data är det övergripande syftet till varför systemet behövs. Det finns ett värde i att dela med sig av all den information som samlats in så att de som är intresserade kan ta del utav den. När dokumenten endast finns i arkiv på ett museum kan det vara många som inte tänker på att det går att få tag på även om det idag är möjligt.

Till denna kategori hör också funderingar från intervjuerna om vad som kan tillgängliggöras och vad som sker med dokumenten då man gör de tillgängliga. Vissa insamlade intervjuer finns transkriberade men det finns även ljudinspelningar av intervjuer. Går dessa att göra tillgängliga? Hur gör man en ljudinspelning anonym? Även problem med att dela med sig av kvalitativa data kom upp under intervjun. För någon som läser en transkription av en gammal intervju kan det vara svårt att tolka materialet på samma sätt som om man varit där eftersom man saknar kontexten. Kan verktyget på något vis hjälpa till i att ta del av originalsituationen?

(24)

19 4.1.2 Tidskrävande

Denna kategori är relaterad till ’Tillgängliga data’ och innefattar det som upplevdes vara det största hindret för att tillgängliggöra de dokument som finns. Arkivarierna har inte tid eller resurser att gå igenom alla de dokument som finns för att ta bort känslig information. Arkivarierna sa att om det blir lättare att eller går smidigare att tillgängliggöra dokument så ökar deras incitament för att sätta igång. Denna kategori är beror på de tre underliggande kategorierna okunskap, noggrannhet samt svårt att hitta dokument.

4.1.3 Osäkerhet

Denna kategori baseras på vad arkivarierna gör idag. De som intervjuades hade inte testat något existerande verktyg för tillgängliggörande och visste heller inte om det fanns något att använda. De pratade även om svårigheter med att börja processen med att tillgängliggöra dokument eftersom de inte vet i vilken ände de skall börja och vad som skall hända med anonymiserade dokument sen. Hur skall de göras tillgängliga? Vem skall ansvara för att de skall finnas tillgängliga? Många frågor som behöver besvaras innan de känner sig redo för att sätta igång med tillgängliggörande processen på allvar.

4.1.4 Noggrannhet

Om man skall tillgängliggöra ett dokument som innehåller känslig information är det väldigt viktigt att den känsliga informationen faktiskt är borttagen eller redigerad på sådant vis att man inte kan identifiera personer från texten. Det förutsätter att de som går igenom texten är otroligt noggranna för att inte missa något. De höga kraven på noggrannhet gör att processen med att tillgängliggöra dokumenten tar längre tid. Hade det inte varit så höga krav på att känslig information inte får missas skulle det kanske varit möjligt att automatisera processen och på så göra den mindre tidskrävande.

4.1.5 Svårt att hitta dokument

Denna kategori uppstod både från hur det går till idag samt hur arkivarierna önskar att det kan fungera i framtiden. I dagsläget har de svårt att hitta relevanta dokument om de blir tillfrågade från en forskare att titta på dokument som berör ett visst ämne eller tidpunkt. De måste manuellt gå igenom sina arkiv med dokument, ingen sökning eller filtrering av dokumentens innehåll är möjlig. Skulle dokumenten dock göras tillgängliga online är förhoppningen att det skall gå att söka på och filtrera dokument för att lättare hitta sådant man är intresserad av. I dagsläget bidrar svårigheten med att hitta dokument till att göra processen mer tidskrävande. Skulle de finnas tillgängliga online försvinner denna aspekten av tillgängliggörandet av data.

(25)

20 4.1.6 Förbearbetning av analoga data

Detta arbete fokuserar på att titta på ett verktyg som redigerar dokument som redan finns i digitalt format. Från intervjuerna framkom dock att det finns stora mängder dokument i pappersformat. För att dessa skall kunna göras tillgängliga online krävs en digitaliserings-process där de förs in i datorn för att sedan förberedas för publicering på nätet. Swe-Clarin har föreslagit att detta kan göras genom OCR (Optical Character Recognition). Även denna process är inte utan fel och kräver ofta att någon kontrollerar de inskannade texterna. Denna kategori hänger ihop med kategorin Modulär.

4.1.7 Modulär

Modulär var en kategori som uppstod ur den insamlade datan från möten mellan Swe-Clarin och Arbetets museum. Swe-Clarins mål är att göra ett verktyg som passar bra på flera olika sorters texter. För att göra detta kan det krävas att man behöver kunna anpassa systemet. Exempel på detta skulle kunna vara att lägga till en ordlista innehållande känsliga ord som är specifika för en given domän. Som nämndes ovan hänger denna kategori även ihop med förbearbetning av analoga data. Swe-Clarins förhoppning är att man skall kunna ta ett pappersdokument, skanna in det i datorn och med OCR skapa en digital kopia som man sedan anonymiserar innan det publiceras online. I dagsläget ligger dock fokus på de dokument som redan finns i digitalt format. Det hade därför varit önskvärt om systemet är modulärt så att det kan byggas på med en OCR-modul i framtiden.

4.2 Specificering av krav

Med affinitetsdiagrammet färdigt fanns det en övergripande bild av vilka användarna var, vad de hade för mål och hur deras verksamhet fungerar. Dessa insikter användes i skapandet av effektkartan som beskriver önskad effekt och hur den skall nås.

I avsnitt 2.3 beskrevs att effektkartan ofta illustreras som ett träd där syftet är rotnoden. Arbetet med effektkartan började med att definiera detta syfte, alltså den önskade effekten som systemet skall ha. Efter detta följde definiering av målgrupper utifrån vilket användningsmönster de kan tänkas ha samt vilken funktionalitet de kan tänkas behöva. För varje målgrupp skrevs ett antal användningsmål ner, de beskriver vad målgruppen behöver och även vad som behövs för att de önskade effekterna skall uppnås. Till varje användningsmål kopplades ett par åtgärder, de är förslag på hur systemet behöver utformas och vad det bör innehålla för att användningsmålet skall uppnås. Nedan presenteras effektkartan och en förklaring av resonemanget som ledde fram till varje nod i grafen.

(26)

21 ❖ Önskad effekt

o Effektiv förberedning av texter med känslig information för publicering på internet

❖ Målgrupper

o Vanlig användare

▪ Kunna redigera känslig information i dokumenten snabbare • Åtgärd 1 - Lätt att se vilka ord som behöver redigeras • Åtgärd 2 - Tydligt vilka ord som har redigerats

• Åtgärd 3 – Finnas möjlighet att ignorera förslag från verktyget • Åtgärd 4 – Enkelt att redigera ord

▪ Åtgärdade texter skall vara lätta att hitta

• Åtgärd 1 – Möjlighet att ange metadata för en text • Åtgärd 2 – Anonymiserade texter lagras i ett format som

möjliggör sökning/filtrering baserat på metadata ▪ Möjlighet att bifoga exempel från originaldata

• Åtgärd 1 – Fält för bifogande av fil som hör samman med en text

o Redaktör

▪ Kunna granska texter innan publicering

• Åtgärd 1 – Vy med verktyg för granskning av texter • Åtgärd 2 – Möjlighet att få reda på när en text är redo för

granskning o Systemadministratör

▪ Möjlighet att anpassa systemet för olika domäner

• Åtgärd 1 – Finnas stöd för att ändra vilken språkmodell som används för systemet

• Åtgärd 2 – Finnas möjlighet att lägg till regler för identifiering av specifika entiteter

• Åtgärd 3 – Finnas möjlighet att lägga till ordlistor för den specifika domänen

❖ Mätpunkter

o Hur snabbt en text anonymiseras av användaren

o Hur många ord/fraser som inte är märkta av systemet anonymiseras o Hur upplevs verktyget av användaren

4.2.1 Önskad effekt – Effektiv förberedning av texter med känslig information

I inledningen nämndes att anonymisering är en tidskrävande process, även från intervjuerna och var detta något som stod ut som ett huvudsakligt problem. En konsekvens av detta är att dokument inte tillgängliggörs i större utsträckning utan endast när museerna blir tillfrågade om att lämna ut dokument. Att processen tar så mycket tid gör att arkivarier har svårt att hinna med denna aktivitet parallellt med sina andra arbetsuppgifter. Syftet med att ta fram detta system är således att öka effektiviteten av denna process så att samtliga arkiverade dokument kan

(27)

22

anonymiseras utan att kräva onödigt många arbetstimmar. När texterna väl finns tillgängliga online skall det också vara lätt för såväl arkivarier som för allmänheten att hitta relevanta dokument. Detta kräver att det går att söka och filtrera bland de dokument som ett museum har publicerat. Förhoppningen är att systemet skall underlätta processen så pass att det känns överkomligt för museerna så att de i förlängningen kan göras tillgängliga.

4.2.2 Målgrupp 1 – Vanliga användare

De vanliga användarna är den grupp som kommer utföra merparten av arbetet med att tillgängliggöra dokument. Det är de som sitter i verktyget och går igenom texterna för att leta känslig information samt lägger till metadata som kan användas för sökning och filtrering. Som nämndes i inledningen fanns det i början av projektet en önskan om att anonymiseringsprocessen kunde vara helautomatisk. Detta är dock inte möjligt med dagens språkteknologiska verktyg, det är lätt hänt att systemet missar information som kan identifiera en person eller ändrar på något som inte är relevant. Det är också problematiskt för ett helautomatiskt system att bestämma vad som skall göras med den känsliga information som hittas. Skall informationen redigeras (och i sådana fall hur) eller tas bort helt? Dessa typer av beslut beror på kontext och behöver övervakning av en människa. För att processen inte skall ta alltför lång tid att utföra (att uppnå den önskade effekten) har tre användningsmål för denna målgrupp med tillhörande förslag på åtgärder identifierats.

Det första användningsmålet grundar sig i kategorin ’Tidskrävande’ som presenterades i avsnitt 4.1.2. Där beskrevs att det största hindret för att tillgängliggöra dokumenten är den tid det tar att hitta och redigera känslig information. Därför är de vanliga användarnas huvudsakliga mål att det skall gå snabbare att redigera dokumenten, om detta mål uppnås kan även den önskade effekten nås. För att nå detta användningsmål har fyra åtgärder föreslagits. Den första åtgärden syftar till att hjälpa användaren se vilka delar i texten som behöver åtgärdas. I ett vanligt ordbehandlingsprogram ser alla ord likadana ut vad gäller exempelvis typsnitt och färg, detta kan göra det lättare att missa ord som kan behöva redigeras när man läser igenom texten. Som nämndes i avsnitt 2.4 finns det olika principer i gränssnittsdesign att utnyttja för att påkalla användarens uppmärksamhet. Om systemet på något vis kan göra det tydligt för användaren var i texten det finns innehåll som bör redigeras förväntas processen att åtgärda samtlig känslig information att förkortas. Det blir heller inte lika ansträngande för användaren eftersom denne inte behöver söka i texten i samma utsträckning. Vidare skall det vara enkelt att se vilka delar som redan blivit redigerade. Om användaren exempelvis tar en paus i anonymiseringsprocessen skall det vara enkelt att ta upp samma dokument igen. Detta innebär att användaren inte skall

(28)

23

behöva fundera över var de slutade senast och behöva leta sig tillbaka. Genom att åtgärdade ord presenteras på ett unikt sätt får användaren en god överblick av vad som är avklarat och vad som återstår att göra. Om systemet föreslår ord som kan vara nödvändiga att redigera skall även dessa förslag kunna ignoreras av användaren. Dessa ord bör då också markeras för att hjälpa användaren se vad som gjorts och vad som återstår. Som sista åtgärd skall det vara enkelt för användaren att redigera ett givet ord. Att det skall vara enkelt innebär här att det skall kunna göras med få knapptryck och kräva lite eftertanke från användaren på vad som behöver göras. Det kan till exempel innebära att systemet ger förslag på vad ett ord skall ersättas med, användaren behöver då endast godkänna eller avslå detta förslag. Förslagen som ges av systemet bör därför också vara så relevanta som möjligt. Om ett namn i texten får ett visst ersättningsförslag skall samma förslag ges längre ner i texten för samma namn (om det refererar till samma person). Även ord som inte systemet föreslagit en ändring för skall vara lätta att redigera.

Det andra användningsmålet kommer från kategorin ’Svårt att hitta dokument’ i affinitetsdiagrammet. I dagsläget finns insamlade data i textfiler och är kategoriserade efter vilken insamling de tillhör och kanske även när denna insamling gjordes, någon ytterligare indelning finns inte. Detta gör att det är svårt för arkivarier att ta fram relevanta dokument vid en förfrågan. Att få tag i dokument som endast berör personer av ett visst kön eller intervjuer med människor från en specifik organisation blir ännu ett farthinder i arkivariernas arbete när de är lagrade på detta vis. Om dokumenten skall finnas tillgängliga för allmänheten via internet behöver det bli lättare att hitta relevanta dokument. Detta mål är stöttat av två åtgärder som hjälper till i processen med att förbereda texter så att de blir lätta att söka i och filtrera när de finns tillgängliga på internet. Som första åtgärd föreslås en möjlighet att ange metadata om en text för att möjliggöra filtrering och sökning. Metadata, alltså data om data, skulle kunna vara kön på den som skrivit texten, yrkestillhörighet eller annan information om texten som kan användas för att kategorisera den. Det är upp till museet och arkivarien att bestämma vilken typ av metadata deras texter skall innehålla. Det räcker dock inte att endast ange metadata för ett dokument om det skall gå att söka efter eller filtreras. Texten måste även lagras på ett sätt där metadata om texterna kan lagras och de kan sökas ut och filtreras. Denna åtgärd handlar både om filformatet på själva texten men även vilken teknisk lösning som används för att lagra dessa filer.

Det tredje och sista användningsmålet för denna målgrupp handlar en möjligt att tillgängliggöra exempel från originaldata. Som nämndes i avsnitt 4.1.1 fanns det funderingar om att det kan

(29)

24

vara svårt för någon som inte varit med vid observations eller intervjutillfället att tolka tillgängliga kvalitativa data. När exempelvis en inspelad intervju transkriberas och sedan går igenom en anonymiseringsprocess finns ytterligare risk för att information som kan vara viktig för att få en bra bild av intervjutillfället försvinner. För att motverka denna förlust av kontextuell information skall användaren kunna bifoga utdrag från originaldata om sådan finns. Här skulle man också kunna bifoga kommentarer eller dylikt från den som utfört en intervju om dennes syn på datan och varför det samlades in. Som åtgärd för detta mål föreslås att det för varje text finns möjlighet att bifoga en eller flera filer.

4.2.3 Målgrupp 2 – Redaktörer

Denna målgrupp skapades med grund i kategorin ’Noggrannhet’ från affinitetsdiagrammet samt det förslag på arbetsflöde som tagits fram av Swe-Clarin som nämndes i avsnitt 1. Målgruppen har ett annat användningsmönster än arkivarierna, tanken är att det skall finnas en eller flera redaktörer vars roll är att granska ett åtgärdat dokument en sista gång innan det godkänns för publicering. Med denna extra granskning är förhoppningen risken för att ett dokument innehållande känslig information publiceras minskar. De museer där intervjuerna i förstudien ägde rum är så pass små att administratören troligtvis är samma person som utför anonymiseringen. Detta förhindrar dock inte att det finns stöd i systemet för denna typ av indelning av roller för att underlätta för större organisationer. Redaktör har ett användningsmål.

För att kunna godkänna texterna innan publicering måste det finnas något i systemet som underlättar denna process. För att administratörerna skall kunna nå detta mål föreslås två åtgärder. Den första är en vy eller ytterligare verktyg för granskning som redaktörerna har tillgång till. De kan se över vilka ändringar som gjorts av en användare och välja att göra ändringar själv eller ge feedback. Det bör också vara möjligt att få en notis när det finns en text som är redo att granskas. Detta förhindrar att administratören måste gå in i systemet för att se om det finns texter färdiga. Denna åtgärd bör vara valbar för att underlätta i exempelvis de fall där en person är både vanlig användare och redaktör.

4.2.4 Målgrupp 3 – Systemadministratör

Systemadministratörer är de personer som kan hjälpa museer och organisationer att sätta upp och konfigurera systemet. Kategorin ’modulär’ från affinitetsdiagrammet innebär att systemet skall gå att anpassa, men för detta behövs ofta språkteknologisk kunskap som slutanvändarna inte alltid besitter. Systemadministratörer är tänkt att vara personer från exempelvis Swe-Clarin

(30)

25

som kan hjälpa slutanvändare att se till att systemet fungerar så bra som möjligt för deras texter. Systemadministratörerna har ett användningsmål.

Inom vissa domäner vill man kanske märka upp väldigt specifika ord och det underlättar då om systemet märker ut dessa åt användaren. Genom att systemet erbjuder möjlighet att lägga till regler och ordlistor för att märka ut specifika ord är förhoppning att risken att missa känslig information minskar. Det skall också vara möjligt att ändra vilken språkmodell som systemet använder sig av om detta skulle anses nödvändigt. Detta låter även systemet hållas relevant i framtiden skulle nya, förbättrade modeller för namnigenkänning på svenska tas fram.

4.3 Produktion av lösningar

Med effektkartan färdig började arbetet med att ta fram designlösningar. Denna process följde det tillvägagångsätt som presenterats i avsnitt 2.4, att skissa flera idéer och utvärdera dem med hjälp av plus och minuslistor för att komma fram till de bästa lösningarna. Designlösningarna fokuserade på åtgärderna för de vanliga användarnas huvudsakliga mål, att snabbare kunna redigera känslig information.

En av de viktigaste åtgärderna för detta mål är att enkelt kunna se vilka ord som behöver åtgärdas. Här utforskades olika lösningar baserade på de design-principer för att påkalla användarens uppmärksamhet som presenteras i avsnitt 2.4. Det beslutades att ord som är känsliga skall markeras i en annan färg så att de sticker ut från resterande text. Denna lösning valdes eftersom den på ett lätt och tydligt sätt kan påkalla användarens uppmärksamhet. Andra lösningar som övervägdes var att visa en lista med samtliga ord som kan vara känsliga som användaren får gå igenom. Denna lösning valdes bort på grund av att kontexten är viktig när man tar beslut huruvida ett ord behöver anonymiseras eller ej. Att använda färger för att visa vad som behöver redigeras gjorde också att samma lösning valdes för att tydligt visa vilka ord som har redigerats, då visas ordet i en annan färg. Den enda funderingen kring denna lösning var att användaren måste veta vilken färg som betyder vad, men detta bör de kunna lära sig snabbt.

Systemets layout hade ett flertal förslag. Ett av dem innefattade två vyer av texten bredvid varandra. Den ena är originaltexten som inte går att redigera och inte har några markerade ord. Den andra går att redigera och ord med föreslagen ändring är markerade i färg. En skiss på detta förslag presenteras i Figur 6 nedan.

(31)

26

Figur 6: Skiss över ett tidigt förslag på layout. Här visas texten som original till vänster och i redigeringsbar version till höger.

Det positiva med denna lösning är att originaltexten alltid går att läsa och kontrollera mot, skulle den redigerande texten genomgå stora förändringar. I denna lösning var tanken att ord som av systemet uppfattas som potentiellt känsliga ersätts med något och ges en färg för att visa var ändringar gjorts. Det var dock svårt att komma fram till bra lösningar på hur användaren skulle kunna ignorera systemets förslag. I detta fall hade man varit tvungen att titta i originalet för att se vad som stod där från början och själv ändra tillbaka i den vy som går att redigera. Istället valdes en annan layout och lösning på hur man kan ignorera förslag.

I denna layout är det bara ett textfält i mitten av fönstret. De markerade orden ersätts inte direkt av systemet utan ett förslag på ersättning visas vid sidan av det markerade ordet. Förslaget visas i en kombobox som kan innehålla flera olika förslag. Det gör det möjligt för användaren att välja vad det känsliga ordet skall ersättas med. Där finns även en knapp för att avfärda systemets förslag. På detta vis är originalet och den föreslagna ändringen på samma plats, enligt Fitts lag som presenterades i avsnitt 2.4 bör detta innebära att det går snabbt att avfärda eller ändra ett förslag eftersom de befinner sig nära det användaren arbetar med. En skiss för denna layout visas nedan i Figur 7.

(32)

27

Figur 7: Skiss över förslag på hur ersättningsalternativ presenteras

Den sista åtgärden för att nå effekten snabbare redigering är att det skall vara lätt att redigera ord, detta innefattar som nämndes i 4.2.2 även ord som systemet inte markerat. Lösningen för detta förlitar sig också på Fitts lag. För ord som redan är markerade kan man ändra vad de skall ersättas av med hjälp av komboboxen bredvid ordet. För ord som inte är markerade övervägdes två lösningar. Den ena, att det skall gå att skriva i texten och ändra precis som i ett vanligt ordbehandlingsprogram. Den andra genom att klicka på ett ord och få upp en kontextmeny med verktyg för att redigera. Efter övervägande valdes den andra lösningen. Anledningen är först och främst att det innebär att ord som är markerade av texten samt omarkerade ord behandlas på liknande sätt. På så vis blir systemet mer konsekvent. En skiss av denna lösning visas nedan i Figur 8.

(33)

28

Figur 8: Skiss på hur redigering av ord som verktyget inte föreslagit.

Med dessa lösningsförslag framtagna började arbetet på prototypen som kom att användas i utvärderingen. Prototypen skapades med hjälp av HTML, CSS och JavaScript.

4.3.1 Genomgång av prototypen

I prototypen visas först en sida där en text har öppnats och ”analyserats” av systemet. Ord som är potentiellt känsliga markeras med en ljusblå bakgrund och dess ersättningsförslag visas till höger.

(34)

29

Till vänster om ersättningsförslaget är knappen för att avfärda systemets förslag och till höger en knapp för att godkänna förslaget. Den senare var inte med i skissningen utan tillkom under prototyputvecklingen. Dess funktion är att användaren skall ha möjlighet att markera vilka ord som accepterats för redigering. Ett klick på denna knapp markerar ordet som skall ändras i grönt, se Figur 10 nedan.

Figur 10:Ord som godkänts för ersättning markeras i grönt

Avfärdas ett förslag från användaren genom att klicka på den röda knappen markeras ordet i gul färg, detta visas i Figur 11 nedan.

Figur 11: Ord med förslag som avfärdas av användaren markeras i gult.

Menyn för att redigera ett ord visas i Figur 12 nedan. Här kan man redigera ordet i den första rutan eller välja vad det skall ersättas med ifrån komboboxarna.

Omarkerade ord som redigeras markeras också unikt, hur detta ser ut visas i Figur 13 nedan.

Figur 12: En kontextmeny visas när användaren klickar på ett ord. Efter att ha valt vilken typ av ersättning som skall användas kan man välja vilken referent ordet refererar till.

References

Related documents

Kvinnorna förblir företagare för att de vill utveckla sina tjänster och produkter och skapa tillväxt medan 17 procent av kvinnorna ansåg att de är nöjda och inte har ambitionen

Närmast symbiotiskt med detta har det på många håll lett till en mer eller mindre långtgående användarstyrning av biblioteken: kort sagt, det användarna tycker ska finnas

I de fall jordbruksmark måste tas i anspråk för ny bebyggelse ska det göras på ett genomtänkt vis där ingen mark går till spillo.. Det nu framtagna förslaget för det

De pekar på Östergötland och menar att de lyckades korta köerna när man införde vårdval 2013, men att hörselvården blivit betydligt sämre!. Bland annat pekar man på att

På utvärderingen av hur vi kan förmedla vårt olika metoder att nå eleverna, har vi kommit fram till att vi behöver utveckla inte enbart metoder utan även förmedla vem av oss

“A fundamental reshaping of finance”: The CEO of $7 trillion BlackRock says climate change will be the focal point of the firm's investing strategy. Business insider, 14

Partnerskap i teknikskiftet mot fossilfria, elektrifierade processer inom gruvdrift och metaller.

Det som åsyftas av Wallis &amp; Shepherd vid ovanstående citat är att man när man läser ett manus, till skillnad från när man läser en skönlitterär text måste fylla ut de