• No results found

Etiskt beslutsfattande med maskininlärning

N/A
N/A
Protected

Academic year: 2022

Share "Etiskt beslutsfattande med maskininlärning"

Copied!
64
0
0

Loading.... (view fulltext now)

Full text

(1)

E TISKT B ESLUTSFATTANDE MED M ASKININLÄRNING

VT 2020:KANI18 Kandidatuppsats i Informatik

Jörgen Dellenfalk Philip Rautiainen

(2)
(3)

Svensk titel: Etiskt Beslutsfattande med Maskininlärning

Engelsk titel: Ethical Decision-making with Machine Learning

Utgivningsår: 2020

Författare: Jörgen Dellenfalk & Philip Rautiainen

Handledare: Daniel Yar Hamidi

(4)

Förord

Vi vill framföra ett stort tack till de som har varit med och stöttat oss under arbetet med vår uppsats. Först vill vi tacka vår handledare Daniel Yar Hamidi för den hjälp och rådgivning vi fått ta del av. Därefter vill vi tacka respondenterna Jonas Toftefors och Josefin Rosén för att de tog sig tid och försåg oss med intressant och användbar information. Till sist vill vi även tacka de opponenter och lärare som har visat oss på rätt väg under arbetets gång.

(5)

Abstract

The purpose of this research and its corresponding thesis is to give the reader a deeper

understanding of what the ethical risks with using machine learning are for a decision-making purpose in clinical examination and diagnostics in the medical field. The motive to why identification of these said ethical risks are essential, is also for the purpose of giving the reader an understanding of how these risks can be reduced. The information is gathered through earlier work that shows relevance but also through qualitative interviews with people working in the fields of machine learning. Through comparison of the results from the

interviews with earlier work and other valid and legitimate sources, the result has been derived. The results concluded of ethical risks as a result from insufficient data, workers putting all of their trust in the result from machine learning algorithms, bias caused by humans when constructing the algorithms. Although there are many risks, there are also possibilities which reduce ethical risks consisting of improvement of technology and better implementation of machine learning in a working environment.

Keywords: Machine Learning, Decision-making, Ethical risks, Clinical examination, Diagnostics, Healthcare.

(6)

Sammanfattning

Den utförda forskningen och motsvarande uppsats syfte är att ge läsaren en djupare förståelse kring vad de etiska riskerna med användandet av maskininlärning, för beslutsändamål vid klinisk undersökning och diagnostik inom sjukvården är. Motivet till identifiering av etiska risker är även att ge läsaren en insikt i hur dessa risker minskas. Informationen samlas in genom tidigare arbeten som visar relevans men också genom kvalitativa intervjuer med personer som arbetar inom områden där maskininlärning används. Genom jämförelse av resultaten från intervjuerna med tidigare arbete och andra giltiga och legitima källor har resultatet härletts. Resultatet visar på hur etiska risker är en konsekvens av otillräckliga data, arbetare som sätter allt sitt förtroende för resultatet från maskininlärningens algoritmer och bias som orsakats av människor vid konstruktion av algoritmerna. Flertalet risker finns, men det existerar även möjligheter till reducering av etiska risker som består av förbättrad teknik och bättre implementering av maskininlärning i en arbetsmiljö och organisation.

Nyckelord: Maskininlärning, Beslutsfattande, Etiska risker, Klinisk undersökning, Diagnostik, Sjukvård.

(7)

Innehållsförteckning

1 Inledning 6

1.1 Begreppslista 7

1.2 Forskningsöversikt 8

1.3 Problemdiskussion 9

1.3.1 Forskningsfrågor 9

1.4 Syfte 10

1.5 Avgränsning & Målgrupp 10

1.6 Disposition 10

2 Metod & Datainsamling 12

2.1 Design av Metod 12

2.2 Val av Empiriskt Datainsamlingsinstrument 13

2.3 Intervju 14

2.3.1 Härledning av Intervjufrågor 14

2.3.2 Intervjuguide 14

2.3.3 Val av Respondenter 15

2.3.4 Utförande av Intervju 16

2.3.5 Tillvägagångssätt för Kodning av Intervjuer 16

2.4 Dokumentundersökning 18

2.4.1 Process 18

2.4.1 Val av Dokument 18

2.4.3 Tillvägagångssätt för Kodning av Dokument 20

2.5 Etiska Överväganden 20

2.6 Reliabilitet & Validitet 21

3 Tidigare Forskning & Teoretisk Referensram 23

3.1 Insamling av Tidigare Forskning 23

3.2 Beslutsfattande Med Hjälp av Maskininlärning 23

3.3 Orsaker till Etiska Risker 24

3.3.1 Data 24

3.3.2 Algoritmer 24

3.3.3 Mänsklig Faktor 26

3.4 Reducering av Etiska Risker 27

3.5 Teoretisk Referensram 27

3.6 Teoretiskt Kunskapsgap 29

4 Resultat 30

4.1 Intervju 30

4.2 Dokumentundersökning 34

5 Analys 37

6 Diskussion 42

7 Slutsats 45

Referenser 46

Bilagor 50

B.1 Transkriberingsmönster 50

B.2 Dokumentteman 53

(8)

6

1 Inledning

I det inledande kapitlet beskrivs de forskningsområden som uppsatsen behandlar. Tidigare forskning presenteras och en problemdiskussion där maskininlärning vid beslutsfattande problematiseras med hänsyn till etiska risker som konsekvens vid klinisk undersökning och diagnostik inom sjukvården. Detta leder till två forskningsfrågor som uppsatsen har i uppgift att besvara. En kort bakgrund till ämnet maskininlärning och hur det skapar etiska risker vid beslutsfattande ges, vilket skapar arbetets syfte. Förklaringar av viktiga begrepp, avgränsning och målgrupp, samt upplägget av uppsatsen i sin helhet presenteras även i detta kapitel.

Beslutsfattande i alla dess typer kan vara en lång och utdragen process då det beroende på kontext avgörs vilket beslut som behöver fattas. Större och viktigare beslut inom diverse områden behöver fattas, vilka kan påverka någon eller något under en längre tidsperiod som även har större konsekvenser. En god grund till varför man tar just det beslut man tar är därför nödvändig. Ett av dessa områden där beslutsfattande är en kritisk aktivitet är klinisk

undersökning och diagnostik inom sjukvården. Patientens sjukhistoria och resultat från kroppsundersökningar ska här tydas. Den kliniska diagnostiken innefattar sökande efter tillståndets orsaker samt symptom. Sker felbeslut rådande patientens tillstånd och hur det bör hanteras, kan detta dels påverka patientens hälsa, men det kan även skapa dålig

resurshantering genom att läkemedel och behandlingar ges på dålig grund.

För att förbättra beslutsfattandeprocessen inom klinisk undersökning och diagnostik används resultat från maskininlärning som grund. Användandet av maskininlärning är en

ändamålsenlig metod för att spara in på resurser som redan kan vara strama inom sjukvården.

Maskininlärning kan bidra till en fördelaktigare hushållning av resurser såsom tid, pengar och arbetskraft skriver Vogenberg (2009). Resurserna kan användas på ett mer effektivt vis vilket kan innebära att sjukdomar och åkommor upptäcks snabbare, sjukdomars förbättrings- och försämringskurvor blir tydligare och enklare att analysera. Det kan även i extrema fall vara det som avgör om en patient lever eller dör (SAS 2020).

Likt inom andra områden finns det etiska risker med maskininlärning då tekniken likt mycket annat i världen, inte är perfekt. Många av dessa etiska risker förekommer även när

maskininlärningens resultat används som grund vid beslutsfattande inom klinisk undersökning och diagnostik. Konsekvenserna från dessa etiska risker kan ibland vara påkostande till den grad att om risken inträffar, är det vad som avgör om en maskin med potential att rädda liv inte implementeras eller används till dess fulla kapacitet (Danton, Nigam & Magnus 2018).

För att etiskt beslutsfattande med hjälp av maskininlärningens resultat som grund inom klinisk diagnostik ska ske, behöver sannolikheten för att etiska risker inträffar reduceras.

(9)

7

1.1 Begreppslista

Artificiell Intelligens (AI) - Vetenskapligt område för system som efterliknar mänsklig intelligens såsom; beteende, språkbearbetning, planering och problemlösning (Tecuci 2011).

Maskininlärning (ML) - Träning av ett program genom att mata den med mängder av data som är relevant för sin tänkta uppgift där det sedan skapas en modell som bland annat innehåller dess inlärda faktorer (Chen & Liu 2018). Exempelvis kan det handla om att finna ett visst objekt i bilder såsom cancertumörer i röntgenplåtar, eller bortfiltrering av skadlig e- post genom igenkänning av mönster.

Maskininlärningsmodell - Modell som skapas via en algoritm som går igenom och lär sig av dess tilldelade data. Modellen används sedan i det område den är skapt för och går igenom data den inte tidigare sett för att göra förutsägelser (Microsoft 2019).

Djupinlärning (DL) - Är en del av ämnet maskininlärning som nämns i några av studiens referenser. Med djupinlärning har man skapat metoder som effektiviserat saker som visuell objektigenkänning, taligenkänning, och andra domäner såsom läkemedelsupptäckt. Metoden i sig är en representationsinlärningsmetod med flera representationslager som är skapade via sammansättning av icke-linjära moduler som var och en omvandlar representationen av datan från en primitiv nivå till en mer abstrakt nivå (LeCun, Bengio & Hinton 2015).

Klinisk Undersökning - Är en kroppsundersökning som går ut på att testa och stressa olika vävnader för att hitta den vävnad som är orsaken till symptomen samt bedöma omfattningen och allvarlighetsgraden av sjukdomstillståndet (Öhlin 2017).

Klinisk Diagnostik - Dess syfte är att specifikt uttrycka sjukdomstillståndet i ord. Traditionellt ramverk vid diagnostik: Var är problemet? Vad är dess ursprung? Hur påverkar det patienten?

Varför fick patienten det? (Öhlin 2017, Boyd 2011).

Algoritm - En ändlig instruktion som exekveras för att lösa ett problem (Cook 2009, 102).

Black box - En typ av inferensmotor som gör bedömningar utan någon motivering och förklaring åt användaren (Watson et al. 2019). Bidrar till okunskap hos användaren om modellens uppbyggnad då hen inte vet vilka faktorer som var med i utförandet av bedömningen.

Beslutsfattande - Hur ett beslut fattas och vad det resulterar i beroende på handlingarna, enligt Bradley (2014).

Etik - Är enligt Deschenes och Kunyk (2019, 769) studien om vad som är rätt, fel och om moralisk plikt samt skyldighet.

Risk - Möjligheten till att någonting oönskat inträffar, är det grundläggande tänkandet kring risker enligt Pritchard (2015, 436).

(10)

8

1.1 Forskningsöversikt

Tidigare forskning har gjorts på närliggande och starkt relaterade områden till det som behandlas i denna uppsats. Dessa ämnen som tidigare har behandlats är etiska aspekter av användandet av maskininlärning överlag. Även användandet av maskininlärning som hjälp vid olika beslutsfattandeprocesser men utifrån en teknisk ståndpunkt finns i tidigare forskning (Vogenberg 2019). Reducering av förekommande etiska, samt tekniska risker med

maskininlärning finns, även om området är tunt, sedan tidigare i forskning men inte tydligt genom ett beslutsfattandeperspektiv med klinisk undersökning och diagnotik inom sjukvården som kontext. Forskning kring hur etiska risker uppstår samt kan reduceras och motarbetas är i jämförelse med forskning kring maskininlärningens användningsområden tunn (Vollmer et al.

2018). Den största delen av tidigare forskning kring lösningar för etiska risker med

maskininlärning täcker även nästintill enbart tekniska aspekter (Davis, Lasko, Chen, Siew, &

Matheny 2017). Forskningsläget idag innefattar ett kunskapsgap vad gäller etiska risker och dess lösningar, med maskininlärning vid beslutsfattande inom klinisk undersökning och diagnostik.

I sin artikel om prediktiva och prognostiserande modeller och dess implikationer för beslutsfattande inom sjukvård i en modern lågkonjunktur, presenteras det av Vogenberg (2019) hur prediktiva och prognostiserande modeller kan användas i syfte att reducera kostnader inom sjukvård inom olika typer av beslutsfattandeprocesser. Han kommer fram till hur tillräckliga data är viktigt för att olika modeller ska fungera. I sin skrift där effekterna av tvetydiga data och kognitiva bias har påverkan på hur väl algoritmer i maskininlärningen tolkas. Paulus, Vries, & Walle (2019) förklarar hur viktigt det är med tillräckliga data, då bias annars kan skapas i modellerna. Davis, Lasko, Chen, Siew, & Matheny (2017) kommer även fram till att modeller i sig kan bli etiska risker om de är gamla.

I sin vetenskapliga artikel som undersöker etiska svårigheter med implementation av

maskininlärning inom sjukvård finns det enligt Danton, Nigam & Magnus (2018) en risk att data likväl algoritmer erhåller någon form av bias. Calster, Wynants, Timmerman, Steyerberg

& Collins (2019) skriver i sin artikel som undersöker vikten av att tillgodose transparens för algoritmers funktionaliteter och hur korrekt kalibrering samt diskriminering i algoritmerna är viktigt. Detta är även något som Tiffin & Paton (2018) går igenom i sin undersökning

gällande maskininlärning inom psykiatrin där “black boxes” ses som etiska risker. I journalen International Journal of Law and Information Technology skriver Schönberger (2019) även hur okunskap gällande maskinen i fråga och hur algoritmerna fungerar kan skapa etiska risker. Han förklarar även hur ett korrekt resultat från algoritmerna kan bli etiskt inkorrekt och därför finns det en risk. I sin artikel gällande maskininlärning inom sjukvård och medicin, kommer Deo (2015) fram till att etiska risker kan skapas av korrelations bias inom algoritmer.

Danton, Nigam & Magnus (2018) beskriver även hur användandet av maskininlärning kan bli en etisk risk då algoritmerna kan göra rätt men att det beroende på situationen och kontexten kan bli oetiskt.

(11)

9

1.2 Problemdiskussion

I och med digitaliseringens framväxt har tekniken effektiviserats allt mer och kan nu utföra uppgifter på eget bevåg samt stödja människor i deras uppgifter (Vogenberg 2009). Den artificiella intelligensens underkategori maskininlärning är ett område som möjliggör detta.

Inom dagens sjukvård är ansenligt beslutsfattande essentiellt då det ofta berör människors liv och deras välmående. På grund av detta faktum kan det även vara viktigt att beslut fattas snabbt för att patienters förfriskande ska ske på så kort tid som möjligt. Beslut kan dock bli tidskrävande och en relativt utdragen process inom sjukvården, då resurser i form av personal redan kan vara åtstramade och att lång tid kan läggas på att finna en slutsats till vilket beslut som behöver fattas. De beslut vi människor fattar blir heller inte alltid perfekta vilket kan bero på otillräcklig bakgrundsinformation om patienten och dess åkomma i fråga. Det kan även bero på att läkaren låter sig emotionellt styras vid beslutsfattandet eller att det för personal inte går att göra exakta bedömningar på vad som faktiskt behöver göras vid patienters olika åkommor och diagnoser vid undersökningar och diagnostiska metoder. Med hjälp av maskininlärning kan data analyseras snabbare vilket minskar tiden det tar för att beslut ska kunna fattas, samt kan mer noggranna och specifika slutsatser skapas kring vilket beslut som behöver tas (Tiffin & Paton 2018). Maskininlärning blir därför inte ovanligt att använda sig av inom vården för att assistera beslutsfattandeprocessen.

Allt gott är dock inte perfekt och det finns ofta nackdelar med teknologi, detta gäller även maskininlärning. När det talas om maskininlärning brukar även etik vara ett ord som ofta nämns. Det nämns i ett samband där maskinen inte är kapabel till att göra enligt oss

människor, etiskt korrekta val. Det nämns även i samband där användandet av maskiner som brukar maskininlärning bidrar till skapandet av etiska risker. Dessa etiska risker kan vara allt från bias i resultatet (Rosén 2017), felanvändning av maskininlärning men även att resultatet från maskininlärningens algoritmer får ett felaktigt resultat (Deo 2015). Det råder en evig debatt om maskinerna faktiskt hjälper eller stjälper oss och om de positiva aspekter som maskininlärning tillför är värda mödan. Det finns dock olika metoder och tillvägagångssätt för att motarbeta dessa etiska risker som förekommer vid kliniska undersökningar och diagnostik inom sjukvården med just maskininlärning som hjälpmedel vid beslutsfattande. Om det helt går att eliminera de etiska risker som förekommer är dock ännu oklart. Detta leder till två framställda forskningsfrågor.

1.2.1 Forskningsfrågor

Vad finns det för etiska risker med maskininlärning som grund för beslutsfattande vid klinisk undersökning och diagnostik inom sjukvård?

Hur reduceras sannolikheten att dessa etiska risker med maskininlärning som grund för beslutsfattande inträffar?

(12)

10

1.3 Syfte

Syftet med forskningsarbetet är att undersöka vilka etiska risker som förekommer vid beslutsfattande baserat på resultat från maskininlärning, med kliniska undersökningar och diagnostik inom sjukvården som kontext. Vidare är syftet att skapa förståelse för hur etiska risker som förekommer vid beslutsfattande med hjälp av maskininlärning eventuellt kan reduceras. Detta för att fylla det kunskapsgap som finns i det forskningsläge idag där

användandet av maskininlärning vid beslutsfattande vid klinisk undersökning och diagnostik inom sjukvård råder.

1.4 Avgränsning & Målgrupp

Arbetet är avgränsat till den artificiella intelligensens underkategori maskininlärning med fokus på beslutsfattande. Djupinlärning och andra underkategorier till maskininlärningen valdes att inte behandlas då arbetet hade blivit för omfattande och det hade riktat sig mer mot den tekniska delen av maskininlärning. Då maskininlärning är en del av artificiell intelligens behandlas ibland även artificiell intelligens, men detta i relation till maskininlärning. Arbetet har kliniska undersökningar och diagnostik inom sjukvård som kontext då detta är ett område som frekvent använder sig av maskininlärning och påverkar många personer någon gång i deras liv.

Studiens tänkta målgrupp är framför allt utvecklare av maskininlärningssystem gällande beslutsfattning inom vård. Sjukvårdspersonal är även en del av målgruppen då de kan vara en bidragande faktor till de etiska riskerna som förekommer men även till dess reducering.

Uppsatsen är även användbar för forskare och studerande inom ämnet som vill berika sina kunskaper inom det eller finna inspiration.

1.5 Disposition

1 Inledning

I uppsatsens första kapitel får läsaren en presentation av ämnet som arbetet hanterar. Syftet som knyter samman ämne med forskningsfrågorna redovisas i samband med nödvändiga avgränsningar av arbetet. I problemdiskussionen förklaras problem som texten grundas på för att ge läsaren en förståelse kring vad studien bygger på. Detta påverkar många i denna

digitaliserade värld där mängder av data hanteras och strömmar fram igenom

maskininlärningens modeller och dess algoritmer. Kapitlet presenterar även uppsatsens frågeställningar som används för att uppfylla syftet med arbetet. En begreppslista finns för att skapa en ytterligare förståelse för läsaren angående uppsatsens IT, och andra relaterade termer. Dispositionen ger läsaren en uppfattning och förklaring till arbetets uppbyggnad.

2 Metod & Datainsamling

Det andra kapitlet visar upp och förklarar de metoder som använts under projektets gång vid insamling av empiri. I kapitlet framhävs hur valet av respondenter gick till och vilka

intervjufrågor som användes vid varje intervjutillfälle. Hur skapandet av intervjufrågor gick till för att få den data som behövdes för att nå uppsatsens mål redovisas även, liksom val av dokument för dokumentundersökning samt hur valet gick till presenteras. Reliabilitet och validitet lyfts också fram i kapitlet med en förklaring till hur studien rättfärdigar sin reliabilitet och validitet i samband med insamlingen av empiri.

(13)

11 3 Tidigare Forskning och Teori

I detta kapitel som är det tredje kapitlet i uppsatsen förklaras det hur insamlingen av teori gick till väga. Demonstrering av tidigare forskning och teori sker, vilka förhåller sig till samma eller kringliggande område. Teorin används för att stötta uppsatsens syfte och för att senare kunna hjälpa till att besvara uppsatsens frågeställning. Sist i kapitlet sammanfattas och sammanflätas den insamlade teorin med studiens syfte i kapitlets konceptuella referensram.

4 Resultat

I uppsatsens fjärde kapitel demonstreras de framkommande resultat från insamlad empiri.

Resultatet från utförda intervjuer vars nyckelord, teman och underteman finns i tabellformat som bilagor presenteras. Resultat av dokumentundersökningar presenteras även samt en tabell innehållande de dokument som analyserades i dokumentundersökningen. En hänvisning finns i denna tabell till andra tabeller som kan hittas under bilagor vilka innefattar teman med nyckelord och fraser från dokumentundersökningar.

5 Analys

I detta kapitel analyseras teori med resultat från föregående kapitel som utgångspunkt, där läsaren får gå djupare in i resultaten där de tolkas och jämförs med varandra. Analysdelen finns för att bekräfta om utvalda teorier även gäller i verkliga livet. Inga nya teorier eller egna åsikter vägs in då det har en tydlig koppling till syfte och forskningsfrågor.

6 Diskussion

I diskussionskapitlet sammanfattas det som framgick i analyskapitlet och skribenternas egna tankar infogas i diskussionen. Generalisering av resultat- och analysdel sker där det diskuteras huruvida resultatet kan tolkas annorlunda och vidare diskuteras undersökningen i sig och om det finns behov till fördjupad forskning.

7 Slutsats

I uppsatsens sista kapitel framställs de slutsatser och de svar på frågeställningen som arbetet resulterar i. En summering av arbetet sker på en generell nivå och obesvarade frågeställningar samt utveckling av arbetet tas även upp, som en fortsättning på det befintliga arbetet.

(14)

12

2 Metod & Datainsamling

I detta kapitel beskrivs det hur studien genomförs utifrån de valda metoderna. Kapitlet går igenom den typ av ansats studien inleddes med, hur och var teorin samlades in samt vilka datainsamlingsinstrument som användes. Intervjufrågor som ställdes under intervjuerna och hur valet av respondenter gick till och hur själva intervjuerna gick till. Dokument som valdes för dokumentundersökning, samt hur detta val gick till beskrivs. Dokumentundersökningens processer stegas även igenom. Hur empirin bearbetades samt etiska frågor, reliabiliteten, validiteten av empirin och dess insamlingsmetoder förklaras.

2.1 Design av Metod

Med en induktiv ansats samlar forskarna öppensinnat in empiri utan någon förkunskap angående det valda ämnet och utgår sedan ifrån den information de samlat in för att skapa teori. Här är det även viktigt att insamlandet inte får vara påverkat av andra teorier för att inte skapa några begränsningar för den information som samlas in. Induktion görs även för att en generalisering av resultatet ska möjliggöras för att slutsatser ska kunna dras (Jacobsen 2017).

En deduktiv ansats innebär att teori samlas in innan insamling av empiri. Detta görs för att uppfattningar och förväntningar om hur verkligheten ser ut ska bildas. Insamlingen av teori har även som syfte att berika forskarnas förståelse kring området i fråga. En god

kunskapsgrund om det potentiellt komplexa område forskarna har valt att undersöka är viktigt för att studien ska bli pålitlig och förmedlad på ett korrekt vis. Målet är sedan att kunna besvara de skapade förväntningar och uppfattningar om verkligheten med hjälp av den empiriska datainsamlingen (Jacobsen 2017).

Valet av forskningsansats var i denna studie utav en deduktiv typ. Vi ansåg att en induktiv ansats inte hade passat undersökningen då en god kunskap kring det komplexa ämnet krävdes för att förståelse ska kunna skapas av undersökningens resultat och förmedlas väl till läsaren.

En bekräftelse av huruvida teorin avspeglar verkligheten på ett korrekt vis gjordes genom att härleda vad som behövde besvaras i intervjuerna. Med teorin som bakgrund och de erhållna kunskaper kring ämnet maskininlärning som hjälp vid beslutsfattande vid kliniska

undersökningar och diagnostik inom sjukvård, kunde forskningsfrågor sedan skapas;

Vad finns det för etiska risker med maskininlärning som grund för beslutsfattande vid klinisk undersökning och diagnostik inom sjukvård?

Hur reduceras sannolikheten att dessa etiska risker med maskininlärning som grund för beslutsfattande inträffar?

För att besvara de valda forskningsfrågor valde vi att utföra vår studie genom

metodtriangulering, då enbart empirisk datainsamling genom intervjuer var otillräcklig för att vi skulle kunna besvara frågorna utförligt och korrekt. Enligt Bryman (1997) innebär

metodtriangulering användandet av olika metoder för data- och informationsinsamling för att styrka arbetets reliabilitet och validitet. En kvalitativ insamlingsmetod av empiri valdes därför i syfte att skapa djupare förståelse kring beslutsfattande med hjälp av maskininlärning, som är ett komplext område där generalisering inte är applicerbart. För att kunna besvara de valda forskningsfrågor valdes en kvalitativ studie då det inte går att reducera ner det valda ämnet i siffror. Det krävs att både insamlandet och presentationen av data har en uppbyggnad av ord

(15)

13

och meningar för att ämnets komplexa natur ska bli helt begripligt (Jacobsen 2017). Intervjuer valdes därför som datainsamlingsinstrument likväl dokumentundersökningar över verkliga fall som erhåller relevans till ämnet. Det insamlade material från utförda intervjuer trodde vi på egen hand skulle bli för tunt och möjliggjorde inte ett reliabelt och validerat resultat.

Resultatet från undersökningarna av dokument sammanställdes därför med resultatet från intervjuerna. Detta jämfördes sedan med insamlad teori och tidigare forskning för att bekräfta huruvida det teoretiska innehållet överensstämmer med verkligheten. Relevanta frågor för samtalen med respondenterna härleddes från insamlad teori och de skapade

forskningsfrågorna. De dokument som valdes att granskas för insamling av empiri fanns det störst tillgänglighet, detaljrikedom samt relaterade dokument till.

2.2 Val av Empiriskt Datainsamlingsinstrument

Kvalitativa intervjuer var det valda datainsamlingsintrumentet för primärdata då detta passade arbetet bäst med tanke på att det var en djupare förståelse kring ämnet och information som behövdes för att besvara frågeställningarna. Individuella intervjuer där respondenterna intervjuades enskilt valdes för att det skulle bli en lugn diskussion där det var mer lyssnande än diskussion som skulle ske då respondenterna redan hade goda kunskaper inom ämnet (Jacobsen 2017). Varför en fokusgrupp inte valdes beror på att vi inte ville att svaren skulle påverkas av vad andra tycker, då båda respondenterna visserligen arbetar inom samma område men där de kan ha olika åsikter om det, då de inte arbetar mot samma slutmål. En av respondenterna arbetar från en mer teknisk bakgrund medan den andra jobbar från en mer socio-filosofisk bakgrund. Även om det var de etiska perspektiven som eftersträvades med uppsatsens arbete, var det även viktigt att få med utvecklarnas perspektiv och olika åsikter kring ämnet då de utgör en stor del av arbetet med maskininlärning.

Förvisso var intervjuer ett datainsamlingsinstrument som passade vår studie väl, sett till vilken typ av information och data vi kunde få. Vi befarade däremot att denna data skulle bli

otillräcklig för att besvara forskningsfrågorna då antalet respondenter var lågt. En dokumentundersökning över verkliga fall användes även, då detta kunde berika våra kunskaper om hur det faktiskt ser ut i verkligheten. Dokumentundersökning som datainsamlingsinstrument för sekundärdata valdes då det fanns god tillgänglighet för dokument tack vare digitala databaser, men även för att det fungerade bäst för det ämne studien behandlar. Denscombe (2014) menar att dokumentundersökningar är ett bra sätt att samla in empiri på, då det vanligtvis finns stora tillgångar till data på samma ställe samt att den är opartisk om den kommer från myndigheter eller organisationer som är oberoende.

(16)

14

2.3 Intervju

2.3.1 Härledning av Intervjufrågor

De valda frågorna i intervjuguiden härleddes från befintlig insamlad teori och tidigare

forskning om användandet av maskininlärning vid beslutsfattande vid kliniska undersökningar och diagnostik inom sjukvård. Det teoretiska kapitlet abstraherades vilket resulterade i tre delar; Beslutsfattande med hjälp av maskininlärning, Etiska risker och Reducering av etiska risker. Utifrån dessa tre områden kunde intervjufrågorna sedan härledas för att resultatet från den empiriska insamlingen skulle bekräfta huruvida teorin och den tidigare forskningen avspeglar en korrekt bild av verkligheten.

2.3.2 Intervjuguide

De frågor som härleddes från teorin och tidigare forskning sammanslogs till en intervjuguide som användes i syfte att säkerställa att intervjuer utfördes på samma sätt, varje gång.

Intervjuguiden skickades även till respondenterna i förväg för att de skulle bekanta sig med frågorna och ge välutvecklade svar. Detta skapade även en mer organiserad intervju vilket bidrar till att de intervjuade fick en mer professionell bild av oss som intervjuare vilket kan påverka att de svar vi fick blev mer seriösa. Den inledande frågan används för att dels bryta isen och ge respondenten en bild över hur intervjun skulle utspela sig, men även för att säkerställa att svaren respondenten gav erhåller hög validitet (Jacobsen 2017). Den andra frågan användes för att skapa en bredare förståelse kring ämnet i sin helhet innan det specificeras på ett visst område. Detta var viktigt för att en utökad kunskap kring det mer specifika området skulle vara möjligt att erhållas med en så liten risk för kunskapsgap som möjligt. De nästkommande frågorna används till skillnad från de tidigare frågorna för att det strikt ska gå att jämföra den insamlade teorin med hur det fungerar i verkligheten och därefter besvara de valda forskningsfrågorna och uppfylla syftet med hela undersökningen.

Inledning:

Vad är din erfarenhet inom området maskininlärning?

Beslutsfattande:

Hur kan maskininlärning användas vid beslutsfattande?

o Finns det olika typer av beslutsfattande som maskininlärning kan fungera bättre eller sämre för och varför tror du att det är så?

o Hur påverkar det gällande området hur användbart maskininlärning vid beslutsfattandet är?

Beslutsfattande vid Klinisk Undersökning och Diagnostik:

Maskininlärning överlag är något som används mer o mer i olika former av arbeten, varav ett av dessa områden är kliniska undersökningar och diagnostik inom

sjukvården. Vad ser du för användningsområden för maskininlärning inom just kliniska undersökningar och diagnostik inom sjukvården gällande beslutsfattande?

(17)

15

Då sjukvård är en speciell bransch där man faktiskt arbetar i syfte att direkt hjälpa andra och ibland även rädda liv, hur tror du att man tänker kring etiska dilemman gällande maskininlärning som hjälpmedel vid beslut?

Etiska Faktorer:

Varför tror du att det finns etiska dilemman gällande detta?

o När uppstår dessa etiska dilemman?

o Var uppstår dessa etiska dilemman inom kliniska undersökningar och diagnostik inom sjukvården?

o Hur hanteras etiska dilemman?

Kan du översiktligt förklara hur maskininlärning kan implementeras för att man sedan ska kunna använda resultatet av algoritmerna som grund för beslutsfattande?

Vad finns det för etiska risker med använda resultatet av algoritmerna som grund för beslutsfattande?

Finns det anledningar att tänja på de etiska uppfattningarna vid beslutsfattande?

2.3.3 Val av Respondenter

Vid valet av respondenter var det viktigt att säkerställa att intervjuerna skulle resultera i relevant och korrekt data som kunde användas i diskussions- och slutsatsskapande. Vi hade därför som avsikt att intervjua respondenter som erhåller expertis inom området

maskininlärning utifrån en etisk ståndpunkt, men som även har goda kunskaper om maskininlärningens tekniska sida för att få en bred bild av ämnet.

För att finna respondenter som vi ansåg skulle kunna erhålla de kunskaper vi sökte

genomfördes internetsökningar på företag som är väletablerade inom IT-branschen, där de på respektive hemsidor och bloggar redogör för hög kompetens inom maskininlärning. Ett mail skickades sedan till kontaktpersonen på olika företag med förfrågan om en medarbetare på företaget med de eftersökta kunskaperna var villig att ställa upp på en intervju. Valet av att skicka mail till respondenterna för inbokning av intervju grundade sig i att respondenterna skulle få den tid de behövde för att planera in en intervju, men även för att mail ofta var det enda sättet dem kunde nås på. De utskickade mailen resulterade i att en anställd från två olika företag kunde medverka i en individuell intervju, vilket kan vara en konsekvens av att Covid- 19 var rådande under tiden undersökningen pågick. Detta kan ha gjort det svårt för företag att finna tid att hjälpa oss med arbetet.

Den första respondenten är Jonas Toftefors som har en magisterexamen inom informatik.

Efter erhållen utbildning har han arbetat som Enterprise Architect vid ett flertal tillfällen, utvecklare och CIO. I dagsläget arbetar Jonas som CDO på Pulsen där han bland annat har som uppgift att starta upp företagets förmågor inom artificiell intelligens. Pulsen är ett av Sveriges ledande företag inom IT-branschen, där de bland annat utvecklar lösningar för både cybersäkerhet men också vården där de har ledande mjukvarulösningar i Sverige (Pulsen u.å.).

Den andra respondenten Är Josefin Rosén som har en masterexamen med inriktning legitimerad apotekare och är även farmacie doktor. Hon har sedan bland annat arbetat som apotekare, applikationsspecialist och huvudrådgivare inom avancerad analytisk och AI. Idag

(18)

16

arbetar Josefin som övningsledare för AI och analystik på företaget SAS. SAS är ledande i världen inom analystik och har under de senaste 40+ åren hjälpt en stor mängd företag med att samla och analysera sin data. På så vis kan kunderna se vad som fungerar eller vilka brister som finns inom företaget, och kan då allokera sina resurser mer effektivt till förbättring (SAS u.å.).

2.3.4 Utförande av Intervju

Själva intervjun utgick från den tidigare hänvisade intervjuguiden där enklare inledande frågor ställdes för att sätta en god ton på samtalet och för att visa hur upplägget var. Det användes även för att respondenten skulle kunna känna sig bekväm så att avslappnade och ärliga svar skulle ges på frågorna. Vi valde även att låta den som skapade den initiala

kontakten via mail vara den som höll i intervjun då detta kan göra att det känns en aning mer familjärt för respondenten vilket bidrar till en trygghetskänsla när respondenten ska svara på frågorna. Det gör det även enklare att återkoppla till tidigare mailkonversationer och skapar en bättre rytm i intervjun. Medan den ena intervjuade, antecknade den andre så att denne ändå tydligt var med och kunde ta åt sig av informationen men heller inte vara ett störningsmoment för respondenten. Visserligen spelades intervjuerna in, men digitala filer av inspelningar kan tappas bort eller bli korrupta. Det är då viktigt att iallafall ha anteckningar som

informationskälla från intervjun. Med hjälp av att någon som sitter och antecknar kan man även fånga reaktioner från respondenten under samtalet i form av kroppsspråk som inte fångas upp av ljudinspelningar.

På grund av den rådande Covid-19 pandemin fanns det ingen möjlighet att låta intervjuerna hållas genom ett möte som var face-to-face. En intervju som hålls på distans kan istället hållas med hjälp av en plattform som tillhandahåller videokonferenser, då detta på ett bra sätt

efterliknar intervjuer som hålls face-to-face (King, Horrocks & Brooks 2018). En distanserad intervju användes vilket skapade vissa begränsningar men även positiva effekter. Microsoft Teams och kameror användes för att upprätthålla en god kontakt med respondenten och för att säkerställa att olika ansiktsuttryck fortfarande skulle bli uppmärksammade. Detta förenklar även tillgängligheten för respektive deltagare att medverka i mötet, där ingen av parterna behöver vara nära varandra (King, Horrocks & Brooks 2018). Det fanns dock alltid risker för att tekniken skulle fallera för alla inblandade parter vilket hade kunnat medföra en risk av att den drabbade skulle ses som oprofessionell.

2.3.5 Tillvägagångssätt för Kodning av Intervjuer

Efter att varje inspelning var avslutad skedde en transkribering av varje intervju, där även de anteckningar som gjordes under intervjun användes som komplettering, för att skapa

förståelse som användes för att besvara de valda forskningsfrågorna. Enligt Olsson (2008) sker sällan en självanalys där den insamlade datan direkt talar om vad som är intressant med den och just därför krävs en aktiv bearbetning av datan. Efter transkribering söktes det i vardera transkribering efter nyckelord i form av enstaka ord eller kortare meningar med avsikt att reducera texterna för att göra de mer lättöverskådliga samt göra de enklare att analysera.

När nyckelorden för vardera text hade blivit framtagna delades de först upp i två övergripande teman, ‘Orsaker till Etiska Risker’ samt ‘Reducering av Etiska Risker’. Där fick orden endast tillhöra ett och endast ett tema vardera för att finna den underliggande meningen som berättas, till exempel vad som är viktigt för vardera respondent och vad de faktiskt talar om under deras intervju. Därefter gjordes en nedbrytning av de övergripande teman till mer specifika

(19)

17

underteman där ett fåtal nyckelord och underteman togs bort på grund av irrelevans och saknad koppling mellan varandra. Samtidigt gjordes en sökning bland alla de underteman vi funnit för att hitta mönster. Med dessa mönster ser vi hur våra funna underteman hängde ihop, vilka sedan redovisas i tabeller som finns i bilagor.

Gemensamma underteman som framkom:

Ansvarslöshet

Under detta undertema faller de nyckelord in som handlar om ansvar, och då ansvar inte tas på allvar kan direkta etiska risker uppstå.

Data

I detta undertema hamnar de nyckelord som täcker felaktiga data, data som innehåller bias, för lite data samt dålig transparens över dataflödet som kan skapa etiska problem när maskinen är i bruk.

Mänsklig Faktor

De nyckelord som handlar om mänsklig bias och förutfattade meningar som avspeglas i skapandet av algoritmer och datainsamling för maskininlärning hamnar i detta undertema.

Tillit

Ibland kan förtroendet och tilliten bli alldeles för hög till resultaten från

maskininlärningen och nyckelorden kring detta faller ned i detta undertema. Det beskrivs även hur otillräckligt förtroende för maskininlärningens resultat skapar etiska risker.

Förbättring

I detta undertema hamnar de nyckelord som rör reduceringen av de etiska riskerna samt proaktivt arbete som organisationer kan använda sig av som togs upp under intervjuerna.

(20)

18

2.4 Dokumentundersökning

2.4.1 Process

En dokumentundersökning används också där etiska risker med maskininlärning har förekommit i syfte att berika och utveckla resultatet från intervjuerna. Genom jämförelse mellan olika verkliga fall där etiska risker med maskininlärning inträffat och insamlade data från intervjuer, skapas en klarare bild för hur dessa etiska risker kan påverka beslutsfattande processen. De dokument som valdes hade störst relevans till ämnet och hade även möjlighet att assistera i uppfyllandet av studiens syfte.

För att resultatet av dokumentundersökningen skulle erhålla en hög reliabilitet används en planeringsprocess för textuella verk som skapats av O’Leary (2014).

1. Skapa en lista av texter att utforska (t.ex.., population, urval, respondenter, deltagare).

2. Överväg hur texters tillgänglighet med hänsyn till lingvistiska och kulturella barriärer.

3. Erkänn och bekräfta bias.

4. Utveckla rimliga egenskaper för forskning.

5. Överväg strategier för att säkerställa giltighet.

6. Ha kännedom om den data man söker.

7. Ha etiska problem i åtanke (t.ex.., konfidentiella dokument).

8. Ha en reservplan.

O’Leary (2014) beskriver även vikten av att undersöka dokumentets och skribentens bias samt det dolda innehållet av dokumentet såsom stil, ton, agenda, fakta och åsikter. För att stärka arbetets autenticitet valde vi att använda oss av ytterligare en process på 8 steg skapad av O’Leary (2014).

1. Samla relevanta texter

2. Utveckla ett organisations- och ledningsschema 3. Gör kopior av originalen för anteckningar 4. Bedöm autenticiteten av dokumenten 5. Utforska dokumentens agendor, bias

6. Utforska bakgrundsinformation (ex. ton, stil, syfte)

7. Skapa frågeställningar om dokumenten (ex. Vem producerade det? Varför? När?

Datatyp?)

8. Utforska innehåll 2.4.2 Val av Dokument

DataCamp är en organisation som strävar efter att demokratisera kunskaperna inom data genom att lära ut färdigheter till individer och företag, i hur man arbetar med data. I deras podcast DataFramed (DataCamp, u.å.) är Hugo Bowne-Anderson den som intervjuar

respondenter som ofta genom arbetslivserfarenhet har goda kunskaper inom data i arbetslivet.

Hugo tituleras själv som Head of Data Science Evangelism and Marketing hos företaget Coiled, vilka arbetar med att öka tillgången till skalbar datoranvändning (Coiled, 2020). Vid två tillfällen intervjuades Arnaub Chatterjee som är Senior Vice President of Product på Acorn AI, vilka är ett företag som skapar beslutsstöd åt företag, ofta med hjälp av AI och maskininlärning. I dokumentet Arnaub Chatterjee discusses artificial intelligence (AI) and machine learning (ML) in healthcare (Bowne-Anderson & Chatterjee, 2018) går Chatterjee igenom datavetenskap, AI och maskininlärning samt respektives plats inom sjukvård i

(21)

19

dagsläget. Han går även igenom hur han tror att det kommer se ut i framtiden. Efter detta svarar han på vad Hugo kallar lyssnarfrågor där lyssnare i förhand har fått ställa olika frågor till Chatterjee. I AI in Healthcare: What the Slope of Enlightenment Will Look Like (Bowne- Anderson & Chatterjee, 2020) med Chatterjee beskriver han AI inom sjukvården med relation till The Gartner Hyper Cycle som beskriver olika faser vid introduktion av ny teknologi.

Vidare förklarar han olika saker som är bra med AI inom sjukvården men även saker som behöver förbättras. I slutet tar han även här emot olika lyssnarfrågor.

Socialstyrelsen är Sveriges kunskapsmyndighet för vård och omsorg som syftar till att både utveckla och ge stöd inom hälso- och sjukvård samt socialtjänst. För att redogöra för

utvecklingen och tillståndet inom dessa områden presenterar de varje år en lägesrapport. Det framförda resultatet som presenteras i Tillståndet och utvecklingen inom hälso- och sjukvård samt tandvård (Socialstyrelsen, 2020) baserades främst på tidigare års rapporter från olika myndigheter men även Socialstyrelsen själva. Rapporten utarbetades av utredaren Sara Dahlin med Eva Wallin som enhetschef. På uppdrag av regeringen gjorde Socialstyrelsen en

kartläggning över inriktningen på och omfattningen av användningen av artificiell intelligens inom hälso- och sjukvården. Detta i samband med vidareutveckling av förslag om indikatorer och mätetal för uppföljning av hälso- och sjukvård som bedrivs via dessa tjänster skapar rapporten Digitala vårdtjänster och artificiell intelligens i hälso- och sjukvården

(Socialstyrelsen, 2019). Kartläggningen av AI utgjordes av utredarna Dick Lindberg, Patrik Hidefjäll och Evamaria Nerell. Utveckling av indikatorer och mätetal för digitala vårdtjänster har letts av Erica Brostedt, Charlotte Pihl, Sevim Barbasso Helmers och Mats Granberg.

Camilla Strandberg som arbetar som jurist deltog i båda delarna liksom Eva Wallin som har varit ansvarig enhetschef.

Vinnova är Sveriges innovationsmyndighet som arbetar för att stärka Sveriges

innovationsförmåga samt att bidra med en hållbar utveckling. De mål dem utgår ifrån är mål uppsatta av FN (Vinnova 2020). Deras arbetssätt ser ut så att de identifierar de

utvecklingsområden där deras satsningar kan göra skillnad, där de skapar möjligheter samt drivkrafter hos de organisationer att samarbeta för att möta viktiga samhällsutmaningar. I deras slutrapport “Artificiell intelligens i svenskt näringsliv och samhälle” (Vinnova 2018) publicerade de material som antingen genererats inom program och projekt som finansierats av Vinnova eller som tagits fram internt eller på uppdrag av Vinnova. Denna slutrapport gjordes på uppdrag av regeringen för att göra en kartläggning och analys över hur väl artificiell intelligens och maskininlärning kommer till nytta inom svensk industri samt det svenska samhället.

Cleveland clinic är ett amerikanskt sjukhus, och är det största och mest respekterade sjukhuset i landet. Deras vision är att kunna ge den bästa sjukvården samt att kunna vara det bästa sjukhuset för arbetande. Cleveland clinic ligger i framkant med IT inom vården och använder sig av artificiell intelligens och maskininlärning på flera plan (Cleveland Clinic u.å.). I

artikeln Artificial Intelligence Real Results av Linda Wilson (2018) tas bland annat AI och ML lösningar upp gjorda av Cleveland clinic där den ena hjälper patienten att minska kostnaderna av behandlingen med hjälp av hens patientdata som blivit anonymiserad. Den andra lösningen håller koll så att AI och ML modellerna inte föråldras och håller sig uppdaterade. Det andra dokumentet är en intervju från konferensen American Society of Hematology 2018 (Nazha, 2018) som är ett årligt event fyllt med föredrag och intervjuer om hematologi (ASH 2020). Denna intervju är med Dr Aziz Nazha som är chef över Clinical AI i Cleveland Clinic. I intervjun berättar han om hur de gick tillväga när de skapa en personlig

(22)

20

prediktiv maskininlärningsmodell som förutser resultatet för patienter med blodcancer typen myelodysplastiskt syndrom, där borttagandet av black boxen var ett viktigt steg.

The Royal Australian and New Zealand College of Radiologists (RANZCR) är en ideell förening för att främja vetenskap och praktik av medicinska specialiteter inom klinisk radiologi samt strålningsonkologi. I dokumentet Ethical Principles for AI in Medicine går RANZCR igenom nio principer gällande etik som bör följas vid användning av AI och ML i vården. De nio principerna täcker bland annat bias, transparens, ansvar vid beslutstagande och mer (The Royal Australian and New Zealand College of Radiologists, 2019).

2.4.3 Tillvägagångssätt för Kodning av Dokument

Steg 8 i den andra valda processen av O’Leary (2014) där innehåll utforskas valde vi att använda oss av en innehållsanalys samt en tematisk analys. Likt i kodningen av

transkriberingarna av intervjuerna söktes det efter nyckelord i form av enstaka ord eller meningar som sedan dokumenterades, organiserades och strukturerades utefter arbetets centrala frågor. Dokumenten blev med hjälp av detta mer lättöverskådliga och enklare att analysera samt arbeta med.

Efter att innehållsanalysen var utförd använde vi oss av en tematisk analys där vi sökte efter mönster i de dokumenterade nyckelorden. De framkommande mönster vi såg från

innehållsanalysen kunde vi skapa olika huvudteman av. I dessa teman placerades även vardera nyckelord där ett nyckelord enbart fick inneha ett tema. De valda huvudteman bröts sedan ner till olika underteman med sina nyckelord varav vissa nyckelord inte längre platsade i något tema och var tvunget att plockas bort på grund av irrelevans.

2.5 Etiska Överväganden

I intervjuerna valde vi att följa de fyra huvudkrav gällande etik inom forskning, skrivna av Vetenskapsrådet (2002). De fyra huvudkraven är informationskravet, samtyckeskravet, konfidentialitetskravet och nyttjandekravet. Det första kravet, informationskravet, innebär enligt Vetenskapsrådet (2002) att forskaren/forskarna måste informera de berörda av forskningen vad den faktiskt går ut på. Detta skedde i denna studie redan när vi tog kontakt med de personer eller företagen som vi såg som intressanta respondenter, där vi i mailet presenterade oss personligen och beskrev studiens uppgift. Samtyckeskravet, som är det andra kravet, innebär att deltagare i en undersökning har rätt att själva bestämma över sin

medverkan enligt Vetenskapsrådet (2002). Respondenternas medverkan i studien var hela tiden upp till dem själva och inga av dem var minderåriga. I det tredje kravet som är

konfidentialitetskravet skriver Vetenskapsrådet (2002) att uppgifter om de medverkande i en undersökning ska ges största möjliga konfidentialitet och personuppgifterna ska förvaras utom räckhåll för obehöriga. Vi valde att fråga de båda respondenterna innan intervjuerna ifall de ville medverka anonymt, för att undvika att någon av respondenterna inte skulle våga eller vilja svara ärligt och enligt dem, sanningsenligt om det dem uttryckte sig om skulle kunna påverka dem på ett personligt plan då deras namn eller arbete nämns. Det positiva med att hålla respondenterna anonyma hade varit att vi då fått de förutsättningar som krävs för att få så sanningsenliga svar det går. Det negativa är att en sämre trovärdighet kan skapas hos läsaren då denne själv kanske inte kan finna de intervjuade och deras bakgrund samt kunskaper. Det sista kravet Vetenskapsrådet (2002) skriver om är nyttjandekravet som innebär att de insamlade uppgifter om enskilda personer inte får användas utanför

forskningsändamål. Den empiri och de medföljande personuppgifter som vi samlat in kommer endast att användas för att uppnå studiens mål.

(23)

21

Utöver de fyra huvudkrav från Vetenskapsrådet fanns en del punkter som vi förhöll oss till från en kodex över integritet inom forskning skriven av ALLEA (All European Academies (2018)). De riktlinjer vi följer är de som behandlar etiska ansvarsförhållanden vid

forskningsarbete såsom oredlighet och oacceptabelt beteende inom forskning bland annat fabricering, förfalskning och plagiering. Detta tas även upp av Olsson (2008) där han förklarar hur man varken medvetet eller omedvetet, ska fabricera eller på något vis förvränga vad som yttrats under intervjuerna med någon av våra respondenter till vår favör.

I dokumentundersökningen är det precis som i intervjuerna viktig att säkerställa trovärdighet och korrekthet av den empiri man utvinner. Här användes också ALLEA (2018) som riktlinjer gällande oredlighet och oacceptabelt beteende inom forskning. Forsberg och Wengström (2003) förklarar även hur ett etiskt övervägande vid urval och presentation av källor bör ske vid en systematisk litteraturstudie, vilket vi ansåg även var lämpligt vid vår

dokumentundersökning. Användandet av resultatet från en undersökning i ett arbete medför även en risk av att känslig information kan spridas vid publicering av ett verk enligt

Hammersley och Atkinson (2007, ss. 214 - 216).

Dokument och artiklar kan innehålla bias och vara manipulerade till att gagna någons

infallsvinkel eller perspektiv vilket läsaren kan förlita sig på och vidare sprida desinformation.

Det var därför viktigt att jämföra dokumenten med andra dokument som behandlar samma ämne för att finna olikheter vilket vi ansåg kunde tyda på desinformation. Författarnas kompetens att utge korrekt information säkerställdes även genom en bakgrundskoll. Då den information vi använde oss av finns i olika källor som alla till olika grader är offentliggjorda anser vi att det inte finns känslig information i dem. Det blev även därför viktigt att den information som tolkades, tolkades på ett korrekt vis så att ny desinformation inte skapades.

2.6 Reliabilitet & Validitet

Enligt Jacobsen (2017) är reliabilitet, men som även enligt Ejvegård (2003) kan benämnas som tillförlitlighet, viktigt för att läsaren ska finna tillit till den utförda undersökningen samt att undersökningen ska vara replikerbar. Reliabilitet skapades genom att använda oss av digitala kommunikationsplattformar som spelade in ljud på ett tydligt vis vid intervjutillfällen, vilket gör att det inte råder några tvivel om vad respondenterna uttryckte sig om under

intervjun. Det säger dock inte att missförstånd av vad som uttalades inte kunde ske. Då detta är en risk mot en hög reliabilitet, såg vi till att vi båda dels var närvarande under intervjun, men även att båda förstod respondenternas svar till fullo. Vid behov kontrollerade vi därför med den intervjuade respondenten att vi hade förstått det som var sagt.

En intervjuguide användes på samtliga respondenter varav frågorna var härledda från den insamlade teori. Genom att använda en och samma intervjuguide ökade sannolikheten att likartade svar skulle ges från respondenterna. Detta skapar även en replikerbarhet då det vid ett annat forskningstillfälle går att nyttja samma intervjuguide för andra intervjuer. Sett utifrån det valda ämnet så var frågorna så neutrala de kunde bli för att inte påverka respondenternas svar. Vidare hade samtliga respondenter samma förutsättningar, liknande bakgrund och kunskaper som vi eftersökte vid val av respondenter för att undersökningen skulle vara replikerbar och reliabel. Kommunikationsplattformen som användes vid intervjuerna kommer att kunna användas igen vid senare fall, vilket betyder att intervjuer som hålls i framtiden har goda tekniska förutsättningar att utföras på ett så likartat vis som möjligt.

(24)

22

Replikerbarheten kan avvika ifall de som utför den framtida studien inte har tillgång till studentdatabaserna Primo och LISTA (Library, Information Science & Technology Abstracts) som användes vid dokumentundersökningen för vår studie, dock är det möjligt att dessa källor finns tillgängliga i andra databaser och gratis på internet. Precis som ett noggrant urval av dokument som ska granskas, är även korrekt källhantering och källhänvisning viktigt för att skapa tillförlitlighet hos läsaren. För att öka replikerbarheten beskrivs valda metoder och stegen från insamling av empirin i kapitel 2 Metod & Datainsamling till dess presentation senare i kapitel 4 Resultat.

Med validitet menar Jacobsen (2017) att den empiri som samlas in ska vara relevant för arbetet och besvarar de frågor som ställts i frågeformuleringen. Ejvegård (2003) tar även upp detta där han förklarar validitet som att mätningar sker på det som ämnas att mätas. Jacobsen (2017) delar även in giltighet i två delar; intern giltighet som innebär att forskaren faktiskt undersöker det som de valt att undersöka och extern giltighet som avser om resultatet från ett begränsat område är giltig även i andra sammanhang.

En hög validitet säkrades i denna studie genom de intervjufrågor som ställdes under intervjuerna vilka var relevanta för ämnet och för att empirin skulle bli så gynnsam som möjligt för arbetet. Relevansen av intervjufrågorna säkerställdes genom att härleda dem från uppsatsens valda forskningsfrågor som i sin tur var härledda från tidigare forskning. Vidare stärktes validiteten genom att de utvalda respondenterna skulle ha erfarenhet inom

maskininlärning och/eller inom någon relevant gren i sjukvården. De olika dokument som hittades undersökte vi kredibiliteten av genom att granska källan och dess möjlighet att erhålla korrekt och relevant information.

(25)

23

3 Tidigare Forskning & Teoretisk Referensram

I detta kapitel presenteras den relevanta tidigare forskning och teori som har samlats in för genomförandet av studien. Teorier sammanfattas i de tre kategorierna Användning av Maskininlärning vid Beslutsfattande, Orsaker till Etiska Risker och Reducering av Etiska Risker, vilka sammanflätas och knyts an med syftet i en teoretisk referensram. Det som inte tas upp i teorin presenteras även i delen Teoretiskt Kunskapsgap.

3.1 Insamling av Tidigare Forskning

Tidigare forskning är valt genom sökningar i databaser som LISTA och Högskolan i Borås egen databas PRIMO. Nyckelord såsom “sjukvård”, “kliniska undersökningar”, “diagnostik”,

“etik”, “maskininlärning”, “maskinetik” samt dess engelska motsvarigheter i olika

kombinationer användes för att finna teorier som beskriver ämnet. De skrifter och texter som sedan användes erhåller relevans till det valda ämnet då det var tidigare studier i liknande anda eller litteraturöversikter. Dessa källor erhåller god validitet då de dels finns på

akademiska databaser men även för att de håller sig till ämnet och är jämförelsevis med andra källor korrekta. Maskininlärning och dess områden är även konstant i en utvecklingsfas där nya tekniker och metoder inom både praktik och teori skapas. Därför är det viktigt att källorna som används för teorierna och att teorierna i sig inte är allt för utdaterade, vilket var något som fanns i åtanke vid valet av teorier.

Webbsökningar på ämnet användes även men på ett försiktigare vis då god källkritik är nödvändigt. Flera av källorna är inlägg på bloggar och olika digitala tidningar vilket kan dra ner trovärdigheten då bias ofta förekommer i liknande källor. Det blev därför viktigt att säkerställa att det inte är några inlägg som är reklaminlägg, att de håller sig till ämnet och är relevanta men även korrekta. Detta gjordes genom att kontrollera med andra akademiska källor att de är relevanta och inte har någon tydlig bias. Kontrollering av källornas författare utfördes även för att se vad de har för bakgrund och om de faktiskt skulle kunna ha de kunskaper som krävs för att de ska vara pålästa i ämnet.

3.2 Beslutsfattande Med Hjälp av Maskininlärning

Artificiell intelligens associeras vanligtvis med maskiner som imiterar det mänskliga

kognitiva tänkandet som analyserar, samt tar hjälp av omgivning för att slutföra uppgifter det var skapat att göra, enligt Tecuci (2011). Maskininlärning är en form av artificiell intelligens som kännetecknas av att det utvecklas allt eftersom det får mer erfarenhet. Dess matematiska modell har även testdata som grund som blir basen för framtida lärande. (Chen & Liu 2018, 1- 3).

Besultsfattande inom sjukvård assisteras vanligtvis av olika prognos- och prediktiva modeller som personal kan använda sig av i diverse kliniska undersökningsfall. Prognosmodeller byggs på statistik och gör det enklare för personal att se olika tendenser och mönster i likartade fall för att få ut de bästa möjliga valen för en patient eller en grupp av patienter med avseende på ett specifikt kliniskt scenario skriver Vogenberg (2009). Prognosmodeller används även för att göra det möjligt att se hur en patients tillstånd kommer utspela sig i framtiden och hur det kommer att förändras vilket kan framställas med hjälp av data i form av tidigare fall.

(26)

24

Prediktiva modeller används mer för att identifiera patienter som är i en riskgrupp för olika åkommor och diagnoser. Prediktiva modeller används därför, till skillnad från

prognosmodeller, i ett mer förebyggande syfte, för att personal ska ha möjlighet att arbeta proaktivt vilket verkställs genom riskbedömning för att bedöma patienters och anställdas sensitivitet för ett specifikt läge. Detta ger personalen information som gör det möjligt att tidigt välja lämpliga åtgärder för att påbörja ett motangrepp på de risker som identifierats.

Modeller används även för att resursåtgången ska vara så liten som möjligt och för att dessa resurser sedan ska kunna användas för att hjälpa så många som möjligt (Vogenberg 2009).

Fler som skriver om maskininlärning inom vården där prediktiva lösningar används är Tiffin och Paton (2018). De nämner att denna typ av användning av maskininlärning ökar

effektivitet och precision när det gäller avläsning av till exempel bilder där ett mönster ska finnas. Skribenterna skriver också att maskininlärningen är mer flexibel än de traditionella statistika metoderna, då de är mer linjära och maskininlärningen kan använda sig av flera variabler samtidigt.

3.3 Orsaker till Etiska Risker

3.3.1 Data

Innan algoritmerna implementeras så måste det prövas på existerande data som även kallas testdata. Det förekommer enligt Vogenberg (2009) att denna testdata behöver vara tillräcklig och relevant där Paulus, Vries, och Walle (2019) menar att dåliga eller otillräckliga data kan skapa bias. Detta kan bero på den mänskliga faktorn där testarna, medvetet eller omedvetet, väljer data som möjligen inte uppfyller de krav som krävs.

Google DeepMind och NHS samarbetade för att skapa en maskin som kan lära sig att identifiera ögonsjukdomar som med stor risk kan skapa blindhet hos personer. I deras första arbete stötte de på problem i form av integritetsfrågor då det var icke-anonyma patientdata som används. Även om de använde sig av de metoder som ansågs vara korrekta för

utförandet, rörde det ändå upp ett etiskt dilemma huruvida det är okej att använda sig av patientdata på det viset (Hern 2016).

Samtidigt som en modell framtagen av maskininlärningens algoritmer och tillgångar av data kan förutspå spridningar av vissa sjukdomar eller virus, finns det tyvärr en risk av att denna modell blir föråldrad då nya sjukdomar och virus dyker upp, omkringliggande teknologi går förbi i utveckling och nya analysmetoder blir effektivare. En föråldrad modell med uppgift att hjälpa till med beslutsfattning i kliniska undersökningar och diagnostik inom sjukvård blir en direkt etisk risk, då den inte längre kan litas på och människors liv kan drabbas eller till och med ta slut (Davis, Lasko, Chen, Siew, & Matheny 2017).

3.3.2 Algoritmer

Risken att algoritmerna programmeras för att vara mer gynnsamma för exempelvis en viss typ av patienter finns även. Likaså kan det även programmeras till att vara mer fördelaktigt för externa parter såsom försäljarna av maskinen.

Algoritmerna skapas baserade på information från tidigare skeenden, alltså tidigare

erfarenheter i form av litteratur, journaler eller personlig erfarenhet. Antaganden kan göras att

(27)

25

de som programmerar maskinen och skapar algoritmerna inte alltid enhälligt har den kunskap som krävs för att veta alla variabler som ska programmeras in. De kan behöva ta hjälp av olika läkare och tidigare arbeten, men främst kan de behöva ta hjälp av de läkare som har kunskaper inom området. Läkarnas kunskaper kommer främst från litteratur och tidigare personliga erfarenheter. Beslutsfattande vid kliniska undersökningar och diagnostik inom sjukvården missgynnas av att vara subjektivt baserat då det inte talar om med lika stor

sannolikhet som evidensbaserade beslut om vad som faktiskt kommer att ske. Den mänskliga faktorn är dock något som alltid kommer finnas där och som inte går att förutspå då vetskapen om hur människor kan vilja påverka ett utfall inte alltid existerar. Det finns tidigare fall där maskiner har varit diskriminerande mot hudfärg, kön och åldrar utan någon tydlig evident anledning som stödjer dess huvudsakliga syfte. Detta är ett problem som bör finnas i åtanke vid användande av resultatet av maskininlärning vid beslutsfattande i kliniska undersökningar och diagnostik inom sjukvården (Danton, Nigam & Magnus 2018).

Maskininlärning används ofta för att en prediktiv analys ska kunna genomföras där prediktiva algoritmer beräknar risken för en viss patient med en skara förutsättningar, att drabbas av olika sjukdomar. Med hjälp av denna kunskap som grund kan det sedan bestämmas vad för åtgärder som behöver tas för att säkerställa patientens välmående. Algoritmerna är uppbyggda med hjälp av kalibrering som ser till att algoritmen gör rätt, och en form av diskriminering som ser till att den främst används mot rätt person dvs. den person som faktiskt lider av en sjukdom. Visserligen är diskrimineringen viktigt men det läggs även stor tyngd på hur viktigt det faktiskt är med en god kalibrering så att läkare och annan vårdpersonal kan göra rätt beslut (Calster, Wynants, Timmerman, Steyerberg & Collins 2019).

Det nämns även hur algoritmerna kan ha en form av bias till följd av att algoritmernas beslut baseras på korrelationer som är starka nog, men som inte är baserat på den faktiska orsaken.

Detta problem tas upp av Deo (2015) där han belyser hur det kan vara svårt att programmera algoritmerna för att urskilja olika sjukdomar med varandra och åkommans orsaker och dess samband med olika symptom.

Användandet av maskininlärning där resultatet av dess algoritmer ligger som grund för beslutsfattande gällande åtgärd för olika patienter är vanligt i kliniska undersökningar och diagnostik inom sjukvården. I deras artikel skriver Danton, Nigam och Magnus (2018) att ifall sjukvårdspersonal börjar använda sig av maskininlärning till att diagnostisera och för

rådgivning angående behandlingar istället för att bara använda maskinen som ett hjälpmedel.

Då blir den en viktig aktör i det terapuetiska förhållandet och måste då bli bunden till de grundläggande etiska principerna som vägleder sjukvårdspersonalen såsom hjälpsamhet och respekt för patienterna.

Det beskrivs hur maskininlärning kan vara användbart som hjälp vid beslutsfattande så länge maskinen i sig förhåller sig till grundläggande etiska regler och koncept rörande patienter.

Danton, Nigam och Magnus (2018) skriver att avsikten bakom själva designen av ett system som använder sig av maskininlärning måste beaktas då algoritmer kan bli designade för att utföras på oetiska sätt. Exempelvis kan det beröra guidning mot behandlingar som skulle kunna förstärka statistik utan att ge bättre vård i sig. För att maskinen ska förhålla sig till de rätta aspekterna krävs det att utvecklaren skapar maskinen utefter de grundläggande etiska regler och koncept rörande patienter.

Det finns även fall där algoritmerna i sig rent tekniskt sett agerar helt rätt och att det utifrån en teknologisk ståndpunkt är korrekt. Däremot innebär inte den teknologiska korrektheten att det

References

Related documents

Det sekundära målet är att träna maskininlärningsalgoritmen till den nivå då den framgångsrikt kan approximera ett värde för nya falska och faktiska fall som inte använts

Resultat & slutsats: Studien visar att ledare i fastighetsmäklarföretag genom ett Strukturellt etiskt klimat bidrar till ett Situationsbaserat etiskt

Detta arbete undersöker även vilka språkliga attribut som har stor signifikans vid bedömning av uppsatser i språk, vilket kan vara av intresse för lärare,

Den här studien kommer att visa hur man kan använda sig utav maskininlärning för att kategorisera olika kvitton, men det skulle lika gärna kunna gå att

The results obtained with random initial values of network parameters, M hidden layer neurons and learning rate given by α = 0.05 were satisfactory and gave an answer that was

Definitionen som utgås ifrån är att annonsörer är en tredje part som använder data från Twitter för att tillämpa riktad marknadsföring för sina tjänster eller varor.. Först

Vi jämför i detta projekt tre olika maskininlärningsmetoder för att klassificera försökspersoner som sjuka (perifer neuropa- ti) eller friska (inte perifer neuropati):

Problemet löstes för fem agenter med de båda metoderna för maskininlärning och med olika val av antal stickprovspunkter och neuronnät enligt tabell 4.3.. * Större lager kan ha gett