• No results found

Analys av bilförares uppfattning om interaktionstyperna röst-och gestinteraktion

N/A
N/A
Protected

Academic year: 2021

Share "Analys av bilförares uppfattning om interaktionstyperna röst-och gestinteraktion"

Copied!
39
0
0

Loading.... (view fulltext now)

Full text

(1)

Touchless interaktion med fordon Touchless interaction with vehicles

Analys av bilförares uppfattning om interaktionstyperna röst -och gestinteraktion An analysis of driver’s perception of the interaction types voice -and gesture.

Hannes Runersjö (a17hanru)

Examensarbete inom huvudområde informationsteknologi Grundnivå 30 Högskolepoäng

Kurskod: IT611G Termin: VT20 Handledare: Erik Lagerstedt Examinator: Henrik Svensson

(2)

Förord

Tack till Erik Lagerstedt som har hjälp mig med studien, tack till alla er som har ställt upp som deltagare

&

alla personer runt omkring som har stöttat mig.

(3)

VETENSKAPLIG SAMMANFATTNING

Syftet med denna rapport är att undersöka bilförares uppfattning om touchless som interaktion och med det bidra med kunskap om utforskandet av interaktionstyper använda i fordon. Touchless är ett samlingsnamn som syftar till att människa-datorinteraktion sker utan fysiska beröringar. Två

interaktionstyper inom touchless är röstinteraktion och gestinteraktion. Röstinteraktion syftar till att använda röstkommandon och dialoger för att interagera med ett system. Gestinteraktion syftar till att använda sig av kroppsrörelser i form av gester för att interagera med ett system.

I studien har det genomförts enkäter samt intervjuer. Tidigare forskning har även undersökts kring hur bilförare uppfattar touchless som interaktion. I analysen har ett affinitetsdiagram och ett chi-två test genomförts. Intervju-och enkätdata har kategoriserats till positiva och negativa uppfattningar om interaktionstyperna

Resultatet från enkäten visar att personers generella uppfattning om gestinteraktion är negativ och att röstinteraktion är positiv, men att interaktionstyperna kan vara bra på olika saker. Resultatet från intervjun bekräftar enkätens resultat, det visar även att en kombination av röst-respektive

gestinteraktion möjligtvis kan vara optimalt för interaktion med fordon.

Nyckelord: Touchless, röstinteraktion, gestinteraktion, fordon, användarupplevelse, interaktionsdesign.

(4)

ABSTRACT

The purpose of this study is to examine driver’s perception regarding touchless as an interaction and therefore contribute with knowledge regarding the research of how interactions are being used in vehicles. Touchless is an interaction term that aims towards human-computer interactions that does not require physical touch. Two subcategories to touchless is voice interaction and gesture

interaction. Voice interaction aims towards the use of voice commands as well as voice dialogs to interact with a system. Gesture interaction aims towards the use of body movements in the shape of gestures to interact with a system.

Surveys and interviews have been used in this study. Earlier research about driver’s perception regarding touchless as an interaction has also been considered. The analysis phase includes an affinity Diagram and a chi-square test. Interview and survey data have been categorised into positive as well as negative perceptions regarding the interaction types.

The result from the survey shows that the general perception of the respondents regarding gesture interaction is negative and the perception of voice interaction is positive, however the different interaction types are shown to be more optimal at different systems. The results from the interviews confirms the result from the survey, it also shows that a combination of both voice and gesture interaction can be ideal for interaction with vehicles.

Keywords: Touchless, voice interaction, gesture interaction,vehicles, user experience, interaction design.

(5)

POPULÄRVETENSKAPLIG SAMMANFATTNING

”…interagera med röst och gest vore coolt”.

Har ni någon gång när ni kört eller suttit med i en bil tänkt att det måste finnas något säkrare, smidigare och mer effektivare sätt att interagera med fordonet?

Att köra bil är en aktivitet som för många personer är en central del av deras vardag. Det kan handla om att ta sig till arbete, skola, mataffär, flygplats eller en utflykt ut på landet. Resenärer på fordon som tåg, flyg eller bussar behöver inte vara uppmärksamma på sin omgivning då de själva inte styr fordonet. Att köra bil kräver däremot att föraren är fullt uppmärksam på sin omgivning. Samtidigt som det är viktigt att ha god uppmärksamhet utvecklas teknologi och innovation vilket innebär att bilar får allt mer system och funktioner som behövs interagera med. Eftersom potentiella faror i trafiken kan leda till allvarliga skador eller till och med dödsolyckor är det viktigt att undersöka om det finns ett bättre sätt att interagera med ett fordon.

Touchless är en interaktionstyp som syftar till att människa-datorinteraktion sker utan fysiska

beröringar. Två grenar inom touchless är röstinteraktion och gestinteraktion. Dessa fungerar på så vis att interagera med hjälp av röst respektive kroppsrörelser med ett system. I studien genomfördes enkäter och intervjuer för att besvara studien frågeställning som är att undersöka bilförares uppfattning om touchless som interaktion.

Resultatet visar att personer hade en mer positiv uppfattning kring röstinteraktion och en mer negativ uppfattning om gestinteraktion som bilförare. Det fanns funktioner inom bilen som ansågs mer optimal för de olika interaktionstyperna. Mer komplexa funktioner skulle passa bättre till röstinteraktion såsom navigation och mindre komplexa funktioner skulle passa bättre till gestinteraktion såsom att höja och sänka volym på stereon. Resultatet visar även att deltagarna ansåg att det kunde vara möjligt att kombinera röst-och gestinteraktion i en bil.

Utifrån ett etiskt perspektiv bör däremot touchless även vara anpassat till grupper i samhället som lätt kan glömmas bort, exempelvis funktionshindrade personer. Dessa personer kan ha svårt att röra sig vilket gör det till en utmaning för dem att interagera med hjälp av gester. Deltagarnas erfarenhet av interaktionstyperna spelade en stor roll för deras uppfattning om interaktionstyperna. Deltagarna hade mer erfarenhet av röstinteraktion och mindre erfarenhet av gestinteraktion vilket kan ses som ett samband till att de hade en mer positiv attityd till röstinteraktion än gestinteraktion.

(6)

Innehåll

1 Introduktion ... 1

1.1 Syfte och mål ... 1

1.2 Frågeställning ... 1

2 Bakgrund... 2

2.1 Interaktionsdesign ... 2

2.2 Användarupplevelse ... 3

2.3 Touchless ... 3

2.3.1 Röstinteraktion ... 3

2.3.2 Gestinteraktion ... 5

2.3.3 Kombination av röst och gestinteraktion ... 6

2.4 Självkörande fordon ... 7

3 Metod ... 9

3.1 Genomförande ... 9

3.1.1 Enkät ... 9

3.1.2 Intervju ... 10

3.2.3 Litteratur ... 10

3.2 Forskningsetiska aspekter ... 11

3.3 Analys och kompletterande undersökning ... 12

4 Resultat ... 14

4.1 Kvantitativ data ... 14

4.2 Kvalitativ data ... 14

4.2.1 Röstinteraktion ... 15

4.2.2 Gestinteraktion ... 16

4.2.3 Intervjumaterial ... 18

5 Diskussion ... 19

5.1 Resultatdiskussion ... 19

5.1.1 Erfarenhet ... 19

5.1.2 Kombinerad gest- och röstinteraktion ... 20

5.1.3 Vilket interaktionssätt passar vilken funktion? ... 21

5.2 Metoddiskussion ... 21

5.3 Samhälleliga och etiska aspekter ... 22

5.4 Vidare forskning ... 23

5.5 Slutsats ... 24

Referenser ... 25

Bilagor ... 27

(7)
(8)

1

1 Introduktion

Bilar är en av de uppfinningarna och har funnits sedan 1880-talet (världenshistoria, 2019). Med det sagt är bilar ingen ny uppfinning i dagens moderna samhälle, däremot har bilarna i sig utvecklats enormt och det räcker att endast blicka tillbaka 10 år för att se skillnader i bilar jämfört med bilar som produceras idag. En specifik aspekt som ständigt utvecklas inom bilvärlden är att bilar allt mer inkluderar ett eller flera interagerbara system. Dessa system kan klara av flertal uppgifter såsom att justera volym, ringa ett telefonsamtal, justera stolsvärme, använda/sätta på en GPS, internetsurfa och mer. Detta kan användaren/föraren få åtkomst till via olika typer av interaktioner, de kan trycka på skärmar med deras fingrar, det kan finnas knappar utsatta i bilen som ger åtkomst till dessa system eller så kan användaren interagera med bilen utan att nödvändigtvis behöva röra någonting.

Det kan ske via kroppsrörelser i form av gester som är programmerade till olika kommandon, det kan också vara med ens röst för att interagera med systemet. Dessa interaktioner är inte något som är exklusivt enbart för bilar, interaktionerna förekommer även i andra teknologiska verktyg exempelvis en varuautomat. Däremot fokuserar denna studie specifikt på hur en människa interagerar med bilar.

Ett begrepp som ofta förekommer inom litteratur för interaktion med röst och gester är touchless.

Begreppet har synonymer som handsfree, non contact, contact free och så vidare. Touchless handlar om interaktionen mellan människa och system där fysiska rörelser inte är nödvändiga. I den här studien undersöks två underkategorier till touchless interaktion, nämligen röst och gest. Från och med 1 februari 2018 är det enligt svensk lag olagligt att hålla i mobilen samtidigt som du kör ett motordrivet fordon. Lagens syfte är att få bilförare att ha en bättre uppsikt på vägen de kör på utan att bli distraherad av en mobilskärm, vilket illustrerar vikten av att ha interaktionstyper som inte tar blicken från trafiksituationen.

1.1 Syfte och mål

Syftet med denna studie är att undersöka bilförares uppfattning om touchless som interaktion och med det bidra med kunskap om utforskandet av interaktionstyper använda i fordon. Genom att jämföra insamlade data med existerande litteratur är det möjligt att undersöka om en

interaktionstyp anses mer idealisk än de andra. Bilindustrin utvecklas ständigt och belastas med allt mer teknologi som människan behöver kunna interagera med. Till följd av detta skapas ett

problemområde då potentiella faror i trafiken kan innebära allvarliga skador eller dödsolyckor vilket gör det avgörande att undersöka om det finns en interaktionstyp som är mer lämpad för dagens och framtidens teknik.

1.2 Frågeställning

 Hur uppfattar bilförare touchless som interaktion?

(9)

2

2 Bakgrund

I bakgrundskapitlet presenteras information som är relevant för att förstå rapportens syfte och mål om att undersöka hur bilförare uppfattar touchless som interaktion. I bakgrunden lyfts det litteratur och forskningsartiklar om röst-respektive gestinteraktion mellan en användare och dess system.

Bakgrundsdelen kommer även att beskriva information om bilars utveckling, mer specifikt framtagningen av självkörande bilar och hur det kan påverka interaktionen mellan människor och bilar. En annan aspekt som bakgrunden lyfter är interaktionsdesign och användarupplevelsens betydelse för interaktion mellan bilföraren och bilar.

2.1 Interaktionsdesign

Eftersom studien kommer att analysera olika typer av interaktion är det viktigt att förstå konceptet interaktionsdesign. Preece, Rogers och Sharp (2015) beskriver interaktionsdesign som en aspekt för att underlätta för människor att kommunicera och interagera i sin vardag och i sitt yrkesliv. Mer specifikt handlar det om att en design ska förbättra en användarupplevelse och utvidga vad som är möjligt för en människa i arbete. Thackara (2001) menar att för att få svar på vad interaktionsdesign är ska man använda sig av frågorna hur och varför i samband med interaktionen mellan en person och ett system. Exempelvis, ”HUR går det till vid denna process?” och ”VARFÖR sker det på detta vis?”. Nielsen (1994) beskriver tio heuristiker som går att beskriva som principer/tumregler för att designa för en god interaktionsdesign. Dessa heuristiker är goda tumregler att ha i åtanke vid design eller utvärdering av interaktionen, i det här fallet specifikt interaktionen mellan människa och fordon.

Interaktionsdesign inkluderar många olika områden i samhället, allt ifrån grafisk design,

produktdesign, artistdesign, filmbranschen till mänskliga faktorer. Interaktionsdesign i bil är ett eget område eftersom bilister behöver fokusera på flera aspekter i en trafikmiljö behöver personen i fråga ha tillgång av information från bilens system så smidigt som möjligt. Detta kan handla om allt ifrån vilka gränssnittsikoner som använts vid snabba kommandon på en skärm såsom exempelvis att sätta på radion. Det kan också handla om vilka ord som systemet uppfattar som kommandon av

användaren. Genom att designers fokuserar på själva interaktionsdelen av bilen kommer användaren känna sig tillfredsställd, det ökar säkerheten för bilisten samt andra trafikanter eftersom användaren inte blir för distraherad av systemet och det skulle kunna förbättra bilistens sätt att köra utifrån ett miljöperspektiv.

Preece et al. (2015) förklarar interaktionstyper som det sätt en användare interagerar med en produkt. Produkter utvecklas för att stödja olika interaktionstyper, röstbaserade, gestbaserade, pekbaserade eller menybaserade. Den interaktionstyp som väljs vid utveckling av en produkt beror på produktens användningsområde och användare. De menar att interaktionstypen är

grundläggande för användarupplevelsen och att som designer bör man identifiera rätt

interaktionstyp tidigt i utveckling av en produkt eftersom interaktionstypen hjälper designers att skapa en konceptuell modell. En konceptuell modell har enligt Johnson och Henderson (2002) som syfte att beskriva hur ett system är organiserat och fungerar. De påstår att konceptualisering av en design på den här nivån möjliggör för designers att få ordning på sitt tänk innan de börjar designa sina gränssnittskomponenter. De menar att det finns fyra huvudtyper av en interaktion: instruktion, samtal, manipulation och utforskande. En interaktionstyp som inte är relevant i detta projekt är utforska. Denna interaktionstyp innebär att en användare ska röra sig genom en virtuell miljö som ska illustrera en 3D-värld, ett exempel på denna interaktion är teknologin virtual reality (VR). Enligt Preece et al. (2015) genomförs detta med hjälp av sensorsbaserade rum och teknologi. Utifrån denna beskrivning anses interaktionstypen utforska inte relevant som en interaktionstyp i samband med fordon då en förare måste ha så pass mycket uppmärksamhet på trafiken som möjligt.

Interaktionstypen utforska skulle helt enkelt inte vara effektiv. Faktum är att det skulle till och med

(10)

3

utsätta föraren och andra trafikanter för en betydligt större risk än någon annan interaktionstyp då föraren krävs förflytta sin uppmärksamhet till en virtuell miljö. Däremot kan denna teknik vara mycket användbar i simulatormiljöer då en användare kan träna på sin bilkörning i en virtuell värld och därefter göra så att användaren drar nytta av förtrogenheten av att köra bil.

Preece et al. (2015) beskriver en interaktionstyp som instruera. Denna typ av interaktion är ett sätt för användaren att ge instruktioner om vad personen vill åstadkomma med ett system. Användaren kan beskriva för systemet vad den vill göra via olika tillvägagångssätt. Att skriva in kommandon, välja alternativ från en meny, multipekskärm, röstkommandon, gester eller knapptryckningar är exempel på att instruera. Vanligtvis utförs kommandon och följs sedan upp av ett system som besvarar kommandot. Instruera som interaktionstyp går att finna överallt inom informationsteknologi, ett exempel på att instruera är om en användare vill köpa en dricka ur en varuautomat. Denna

varuautomat har flera olika produkter tillgängliga men som användare är man enbart intresserad av någon/några specifika vid ett köp. Vanligtvis går det till så att användaren skriver in önskad produkt via ett knapptryck och sedan besvarar systemet kommandot med att släppa ned produkten.

Instruera som interaktionstyp har som fördel att aktiviteter utförs snabbt och effektivt. Det är speciellt passande då det finns behov av att frekvent upprepa aktiviteter inom ett system, dessa aktiviteter kan vara att spara, radera eller organisera filer/information.

2.2 Användarupplevelse

En användarupplevelse beskrivs enligt Preece et al. (2015) som hur en människa känner för en viss produkt eller service. Ordet användarupplevelse kommer ifrån engelskans user experience (UX).

Allanwood & Beare, 2014 menar att designers ofta kallar UX för UXD. Det extra d:et ska vara tänkt att upplysa tänkandet på design vid framtagningen av en produkt eller service, vilket därefter blir User Experience Design. Garrett (2010) menar att alla typer av produkter skapar en användarupplevelse, vare sig om det handlar om exempelvis en fjärrkontroll, matkasse, tidningar eller mobiltelefon. Det är många aspekter av användarupplevelsen som kan spela roll vid utformad av interaktiva produkter.

Norman (2004) menar att det inte är tillräckligt med att bygga saker som enbart fungerar, går att förstå och använda, utan att byggandet av produkten även måste inkludera glädje, njutning, spänning och andra känslor. Carroll (2004) betonar även ytterligare aspekter för en designer att ta hänsyn till vid utformning av produkten. Aspekter såsom hälsa, socialt kapital samt kulturell identitet, till exempel ålder, etnicitet, funktionshinder, familjestatus och yrke. Användarupplevelsen är därmed en viktig faktor att inkludera när man utformar olika interaktionstyper för att styra funktioner i fordon. Målet med denna studie är att förstå hur bilförare uppfattar touchless som interaktionssätt. I detta fall är bilförarna användare av dessa system och det är därför viktigt att förstå

användarupplevelsens påverkan på bilförarnas uppfattning av systemen.

2.3 Touchless

I det här kapitlet presenteras interaktionen touchless. Begreppet innebär att interagera mellan användaren och ett system utan att använda sig av knapptryck, en touchskärm eller något liknande där användaren måste trycka. Inom litteraturen kan begreppet nämnas som handsfree, vilket enbart är en synonym till touchless och innebär samma principer.

2.3.1 Röstinteraktion

När Preece et al (2015) diskuterar röstinteraktion, använder de sig av begreppet samtala. De menar att det är när användaren har en dialog med systemet, denna dialog kan genomföras både skriftligt och muntligt. I skriftligt kan användaren skriva in frågor som ett system sedan besvarar i text. I muntligt talar personen till systemet och systemet besvarar kommandot med ljud eller utfärdandet av önskad aktivitet. Systemet agerar helt enkelt som en samtalspartner. Nass et al. (2005) menar att

(11)

4

tala är en elementär egenskap kopplad till att vara människa, vilket innebär att integrera röststyrning som interaktion kommer med en del utmaningar. En aspekt är att manliga och kvinnliga röster påverkar oss olika. Till exempel använde BMW sig enbart av manlig röst i deras navigationssystem eftersom förare (majoriteten tyska män) inte tog vägledningar av kvinnor.

Jonsson, Harris och Nass, (2008) menar att en röstbaserad interaktion skapar mindre distraktioner än en interaktion som baseras på människans visuella förmåga. De argumenterar för att en förare i en trafikmiljö redan belastar sin visuella perception och förare kan därför dela uppmärksamheten mellan ljud och syn. Med det sagt förklarar de att det finns skillnader mellan olika typer av röstinteraktioner. I en bil kan föraren kommunicera via röst genom att lyssna på en röst från fordonet, hålla en konversation i sin mobiltelefon eller ha en konversation med en passagerare.

Jonsson et al. (2008) genomförde en studie där de använder sig av ett system som enbart talar ut information till en bilist, föraren är aldrig delaktig i en dialog med systemet utan tar emot

information via en röst. Information som systemet talar ut varierade från ”Nuvarande maxhastighet är 60 km/h” till ”Varning, en bil framför dig har stannat”. Deras slutsats är att röstbaserad

information kan hjälpa en användare att köra säkrare i form av att köra saktare, användandet av bromsar och färre kollisioner i samband med varningsinformation i form av röst. Alla delar däremot inte uppfattningen om att touchless interaktioner är mer lämpliga än andra typer av interaktioner.

Asif, Vinayakamoorthy, Ren & Green (2009) skriver om ett nuvarande problem med att interagera med bilsystem idag. De menar att bilar har flertal olika system som GPS, musiksystem,

ventilationssystem, elektroniska soltak och så vidare. För att föraren ska interagera med dessa system måste personen i fråga antingen titta bort från vägen, eller belasta den kognitiva

perceptionen med ljudkommandon vilket minskar en förares uppmärksamhet på trafiken. Asif et al.

(2009) har tagit fram en prototyp som inte ska baseras på någon av dessa interaktioner. De kallar det för ”Haptic Control” och förklarar att interaktionen ska vara baserad på fysiska tryck. Asif et al. (2009) menar att man inte ska behöva släppa händerna från ratten och att man fortfarande ska kunna fästa blicken på vägen. Prototypen i form av en knapp installeras på fordonets ratt och ska kunna ta emot kommandon, föraren får dessutom information i form av vibrationer som varierar beroende på situation.

Zhou, Qin, Lin, Hu, Wang och Ren (2019) undersöker problematiken med röstinteraktion i

självkörande fordon. Röststyrda system har integrerats i självkörande fordon. Under utvecklingen av sådana system har en sårbarhet gentemot dolda kommandon som är obegripliga för människor eller kan gå helt obemärkt upptäckts. Specifikt handlar det om att en antagonist använder dolda

kommandon för att kunna kontrollera självkörande fordon vilket gör det här till en studie om tillit till system. Ett exempel är att det kan finnas dolda kommandon inbakade i ljudet av en video delad online, dessa dolda kommandon kan då kontrollera fordonet endast på grund av att videon spelas i fordonet vilket kan göra att fordonet gör aktiviteter trots att bilföraren inte önskat det. Zhou et al.

(2019) undersöker skadan dessa dolda kommandon kan ge samt vilka försvarsstrategier som kan användas mot detta.

Zhou et al. (2019) beskriver att det finns tre faser i de allra flesta röststyrningssystem;

röstupptagningen, taligenkänningen och kommandoutförandet. Attacker på röststyrningssystem delas in i ohörbara röstkommandon (attacker på röstupptagningen) och ljudmotstående exempel (attacker mot taligenkänningen).

De ohörbara attackerna går ut på att ljudlösa syntetiska ultraljudssignaler spelas upp. Dessa ljudlösa signaler kan sedan konverteras till digitala röstsignaler av mikrofonen. De ljudmotstående exemplen går istället ut på att de digitala röstsignalerna förbehandlas och utifrån dem kan kommandon kännas igen och manipuleras. Zhou et al. (2019) går vidare in på försvarstekniker mot dessa attacker. Enligt artikeln finns det redan flertal försvarstekniker mot dessa problem, dock är alla endast fokuserade på

(12)

5

en typ av attack. Zhou et al. (2019) menar att det fram tills nu inte funnits någon övergripande teknik för att lösa dessa problem. Tekniken som tagits fram och testats i denna undersökning är att genom att kunna identifiera ljudets källa kunna stoppa alla attacker mot röststyrningssystem. Zhou et al.

(2019) förklarar vidare hur en teknik för att känna igen ljudet av en användares andning och röst mot mikrofonen kan säkerställa att röststyrningen endast sker med den specifika användaren.

I artikeln beskrivs även ett test som 18 deltagare deltog i som gick ut på att testa och undersöka säkerheten med den nya tekniken som analyserar användarens andning och röst mot mikrofonen.

Alla deltagare fick prata 10 gånger och varje fras varierade mellan 2-10 ord. Zhou et al. (2019) konstaterar att denna försvarsteknik fungerade 96% av försöken när det gällde fraser med 8-10 ord och 90,3% när det gällde 2-4 ord. Zhou et al. (2019) avslutar med att nämna att denna undersökning visar på att denna nya försvarsteknik är ett effektivt sätt att skydda sig mot båda typerna av dolda systemattacker.

2.3.2 Gestinteraktion

Tonnis, Broy och Klinker (2006) vill inte längre att människor ska se fordon som mekaniska objekt, utan istället som en rullande dator med komplexa system. De menar att vi nu har etablerat en skrivbordsbaserad design i en bil för en förare att interagera med. Tonnis et al. (2006) beskriver de flesta gränssnitt inom fordon som väl lämpliga i en arbetsmiljö eller en hemmamiljö med en dator framför sig. Där behöver användaren inte ha fokus på en väg framför sig som den åker fram på, utan kan vara fullt uppmärksam på vad som sker med systemet personen arbetar med. Tonnis et al. (2006) menar alltså att sättet vi interagerar med en bil behöver utvecklas och därefter blir mer anpassade till en trafikmiljö.

Loira, Agulla och Castro (2014) testar och undersöker system som bygger på gestinteraktion.

Systemet tillåter bilförare att manövrera enheter utan att störa förarens uppmärksamhet i trafiken.

Under testerna fick 23 bilförare testa detta system i en bilsimulator såväl som i en riktig bil.

Deltagarna fick även genomföra testet med hjälp av traditionell interaktion i det här fallet med hjälp av en touchskärm, via touchskärmen kontrollerade deltagarna bilens olika system. Systemet

undersöks med hjälp av en infraröd kamera som är belägen i bilens tak, pekandes i riktning mot växelspaken. Kameran övervakar handgesterna som föraren gör i närheten av växelspaken.

Förbestämda rörelserna och gesterna är kopplade till olika funktioner, exempelvis höja och sänka volym, röra sätet framåt eller bakåt och andra vanligt upprepade funktioner i bilen. De förbestämda rörelserna och gesterna är en blandning av både statiska och dynamiska rörelser. Det kan handla om statiska rörelser såsom att visa ett eller flera fingrar för kameran eller göra en ”tumme upp”. Det kan också vara dynamiska rörelser såsom att flytta handen från sida till sida eller öppna och stänga handflatan.

Loira et al. (2014) beskriver även hur systemet och kameran ska lära sig att skilja på rörelser handen utför med andra objekt som kan hamna inom kamerans omfång. Systemet är programmerat att urskilja en hand från andra objekt med hjälp av färg, form och storlek på objekten inom gesternas målområde. Systemet använder sig även av gesterna och rörelsernas “handbok”, systemet jämför objektets fart och bana med hur rörelserna och gesterna är menade att utföras. Med det menar Loira et al (2014) att alla objekt inom kamerans omfång som inte uppfyller alla kriterier för gesternas

“handbok” kommer att uteslutas som bakgrund, vilket kan innefatta ben, kläder och andra objekt.

Resultaten från undersökningen visade att de statiska gesterna uppfattades av systemet 96% av försöken, medan de dynamiska endast uppfattades 87% av fallen. Loira et al (2014) menar att de dynamiska rörelserna var svårare för systemet att hålla isär mestadels på grund av likheterna mellan vänster och höger rörelser. Loira et al (2014) argumenterar dock för att detta resultat kan förbättras i takt med att användarna av systemet anpassar sig till dessa avvikelser.

(13)

6

I artikeln framställs även resultatet av en enkät som samtliga deltagare av studien fick besvara. Loira et al (2014) menar att enkäten var till för att se deltagarnas inställning till traditionell interaktion vilket i det här fallet är med hjälp av en touchskärm jämfört med gestinteraktion. Deltagarna i

undersökningen fick köra en bilsimulator två rundor och en riktig bil två rundor, under tiden skulle de följa en rad av olika handlingar i ordningen; välja ett album, välja en låt, höja/sänka volymen, spela låten, byta låt, höja/sänka volymen, gå tillbaka till menyn, välja låtar, välja en låt och till sist spela en låt. Dessa handlingar görs ena rundan med hjälp av traditionell interaktion och andra rundan med gestinteraktion. Deltagarna fick efter detta utvärdera deras upplevelse i en enkät.

Loira et al. (2014) anser att resultatet av undersökningen och testerna resulterade i några intressanta slutsatser. Enligt resultatet ansåg deltagarna att touchskärmen var mer pålitlig och något enklare att använda. Enkätens resultat visar dock att deltagarna ansåg att gestinteraktionen var mer tryggt, mindre distraherande och lite mer användbart. Deltagarna var även mer intresserade av

gestinteraktion. Loira et al. (2014) avslutar med att påpeka att de anser sig ha designat ett

välfungerande gest interaktionssystem som enligt resultaten visar att det är ett säkrare och i vissa fall effektiva sätt att integrera med sitt fordon.

2.3.3 Kombination av röst och gestinteraktion

I artikeln “Multimodal interaction in the car - Combining speech and gestures on the steering wheel”

av Pfleging, Schneegass och Schmidt (2012) beskrivs utmaningen med att i dagens läge anpassa kontrollinstrumenten i ett fordon För att vara anpassat till de hela tiden utökade funktioner som kan styra bilens/fordonets olika delar av fordonet. Moderna bilar erbjuder ett stort antal underhållnings- och informationsfunktioner såsom Youtube, färglysande LEDljus, GPS och mer. Hjälpmedel

fokuserade på bland annat komfort och assistans är ett område som utvecklas varje dag. Exempel på funktioner som har utvecklats och lagts till de senaste årtiondena är navigationsmöjligheter,

interaktion med stora musikkollektioner, “cruise control” och aktivering av självstyrande parkering.

De allra flesta av dessa funktioner är inte en del av den preliminära köruppgiften, dock är det funktioner många förare måste kunna eller vill kunna styra under körningen.

Pfeging et al. (2012) menar även att det dessutom har skett och sker fortfarande en stor ökning av användandet av mobila enheter under körning. Även fast förbud finns mot att använda mobila enheter under körning för att exempelvis skicka meddelanden, internetåtkomst samt användning av sociala nätverk finns en vilja av att använda enheterna under pågående körning. Pfeging et al. (2019) påpekar att denna trend lär öka i takt med att vi går mot mer självkörning av fordon, då den kognitiva belastningen av körningen minskar.

Pfeging et al. (2012) menar att användandet av enkla fysiska knappar inte längre är tillfredsställande eller praktiskt för en förare. De allra flesta system som finns idag består av en hierarkisk meny vilket innebär att informationen är strukturerad och kategoriserad på ett sådant sätt att all information inte syns hela tiden. Nackdelarna med detta är dock att de gömda funktionerna oftast tar mycket längre tid att hitta än om det hade funnits en fysisk knapp. Alla dessa menyer är även beroende av en touchskärm eller tryck-vrid kontroller av något slag exempelvis knappar, vilket ökar förarens visuella krav samt komplexiteten med att styra olika funktioner i fordonet. Med varje tillagd funktion, assisterande system och självkörande system blir fordons cockpitar allt mer komplexa. Knappar och manuella funktioner är fortfarande av största betydelse i fordonsdesign. Pfeging et al. (2012) förklarar att ingenjörer och designers nu måste bestämma vilka funktioner som behöver en fysisk knapp och vilka funktioner som kommer behöva hanteras på mer komplexa vis.

Pfeging et al. (2012) förklarar vidare att röstinteraktion är ett alternativ, dock är det inte allmänt accepterat bland forskarna. Röstinteraktion stöder inte synlighet av handlingar, enkla sätt att ångra handlingar samt tydlig feedback på förarens handlingar.

(14)

7

Pfeging et al. (2012) beskriver att dem vill använda sig av en annan strategi, en kombination av röst- och gestinteraktion. Röstinteraktion används för att identifiera olika funktioner och ger föraren enkel tillgång till ett brett utbud av menyfunktioner. Gestinteraktionen används för manipulation

(exempelvis höger/vänster), finjusterade funktionsmöjligheter med omedelbar feedback samt enkla sätt att ångra handlingar. I denna studie av Pfeging et al. (2012) undersöks ett nytt system som kombinerar gest- och röstinteraktion. Resultaten visade att i användandet av denna metod var den visuella perceptionen lägre än vid användning av ett menybaserat system. Pfeging et al. (2012) beskriver även att förarens distraktionsnivå under användningen av röst- och gestinteraktionen ligger på ungefär samma nivå som vid användning av traditionella system, dock erbjuder det större

flexibilitet. Pfeging et al. (2012) avslutar med att nämna att ett kombinerat system av både röst- och gestinteraktion är början på ett nytt sätt att kontrollera sitt fordon.

2.4 Självkörande fordon

Kim, Chang, Park och Song (2020) har genomfört en studie i Sydkorea gällande självkörande taxi. Här undersöker de hur en självkörande taxiservice bör vara designad utifrån ett UX perspektiv, allt ifrån hur man får tillgång till en taxi, åkturen och avslutningsvis betalning och avstigning. Data är baserad på fältstudier genomförda på prototyps taxis, här använder Kim et al. (2020) en metod de beskriver som ”Wizard of Oz Method”. De beskriver att metoden är känt inom människa-datorinteraktion området och kommer ursprungligen från filmen/boken Wizard of Oz. Här satt trollkarlen bakom ett skynke och fick berättelsens hjältar att tro att det var en intelligent maskin de hade med att göra. I studiens fall menar de att alla passagerare tror att de använder en autonomisk service, fast det egentligen finns en ansvarig person som styr dessa fordon konstant i bakgrunden. De förklarar att det inte finns någon laglig tillhandahållande för självkörande bilar i Sydkorea, därefter ska deras studie enbart illustrera hur en självkörande service upplevs. Personer som befinner sig i självkörande bilar jämfört med fordon som måste köras och styras fullt ut av en person får olika förutsättningar för hur de interagerar med sina fordon. Hypotetiskt skulle verktyg såsom en ratt, gaspedal samt broms inte vara till någon nytta i en självkörande bil. Genom att en bilist befinner sig i en självkörande bil kommer förutsättningen för interaktionen förändras. Nya funktioner kommer att implementeras såsom att användaren kan tillkalla sin bil till en specifik plats, dessa funktioner måste givetvis vara väl designade för en användare utifrån interaktionsdesigns principer och en god användarupplevelse.

Perez (2017) menar att autonomi och självkörande bilar är en stor anledning till att bilindustrin behöver utveckla interaktionen för en bilförare. Perez (2017) skriver att medlemmar inom Institute Of Electronical and Electronics Engineers (IEEE) anser att den mest lovande intelligenta transport är självkörande bilar. De förväntar sig att mellan år 2025 och 2035 kommer det att finnas självkörande bilar och vid år 2040 kommer ca 75% av registrerade bilar att vara självkörande. Perez (2017) förklarar att det redan idag finns till viss mån självkörande bilar, bilmärken såsom Tesla, erbjuder redan system såsom autopilot där det är möjligt för bilföraren att släppa pedal och ratt varav bilen navigerar själv på en motorväg och andra större vägar. IEEE genomförde en undersökning där över 200 experter inom självkörande bilar som ämne var involverade. De menade att vid år 2035 kommer majoriteten av nya bilmodeller inte vara utrustade med ratt eller pedaler.

Perez (2017) menar att detta skulle ge nya möjligheter för hur människor kan interagera med sin bil och anser att det idag finns begränsningar gällande hur vi interagerar med våra bilar idag. Genom att ta bort ratt och pedaler behöver bilföraren därmed inte längre ha som roll att navigera bilen med hjälp av de funktionerna. Istället kan personen befinna sig vart som helst i bilen och på andra sätt navigera. Perez (2017) menar att utvecklingen kommer med några utmaningar inom människo-bil interaktionen. En av utmaningarna är hur mycket användaren ska ha kontroll över fordonet. Att ge

(15)

8

fordonet kontroll över alla navigationsval skulle innebära en risk att användaren känner sig osäker och obekant med systemet, vilket i sin tur påverkar åsikter om självkörande bilar. Perez (2017) beskriver en utmaning med kontroll över fordonet och menar att det alltid kommer finnas tillfällen då en resenär kommer att vilja göra spontana destinationsbeslut längst vägen, såsom att åka en omväg eller att göra ett stopp som inte var planerat från början. Här kommer användaren att behöva kontroll för fordonet, vilket i det här fallet inte går att genomföra med ratt och pedaler.

Perez (2017) undersöker hur det skulle kunna vara att vid dessa spontana beslut interagera med röst och gestinteraktion för kontroll över bilen (Multimodal interaction system based on voice and pointing gesture commands). Exempelvis, liknande hur man ger vägbeskrivning till en taxichaufför, ska en användare kunna säga saker såsom ”Du kan sakta ner och stanna där framme” eller ”Du kan svänga in där”.

(16)

9

3 Metod

Här kan läsaren ta del av vilka datainsamlingsmetoder som har valts till denna studie och varit grunden i studien tillsammans med motivering av valda metoder.

3.1 Genomförande

3.1.1 Enkät

Vid tidpunkten som studien genomfördes var coronaviruset Covid-19 aktuell. Därmed behövdes några åtgärder tas, det ansågs inte passande att studien skulle förlita sig på undersökningsmetoder där människors hälsa riskerades att påverkas på grund av viruset. Folkhälsomyndigheten gav starka rekommendationer att undvika nödvändiga sammankomster och att hålla två meters avstånd mellan individer. Som metod till en insamling av data ska en enkät genomföras och skickas ut, utifrån den ska en kompletterande intervju genomföra. Då en enkät har möjlighet att nå ut till många individer och därmed ge studien en relativt bred datainsamling har enkät setts som en god metod att använda i arbetet. Det är särskilt passande med användningen av enkät som datainsamlingsmetod i dessa tider då Covid-19 (Corona) har tagit grepp på samhället och gjort det nödvändigt för samtliga

individer att tillta möjliga åtgärder. Det pågående viruset har även påverkat studiens val av metoder.

Enkäten (se bilaga 1) påbörjades i fritext i ett dokument, här togs frågor med åtanke att besvara studiens frågeställning ”Hur uppfattar bilister touchless som interaktion?” Enkäten genomgick flertal utkast som vardera bifogades till ansvarig handledare i studien. Efter respons från handledaren gjordes strukturella, språkliga och tekniska justeringar. Efter första utkastet skrevs frågorna in i ett enkätformulär, programmet använt för att skapa enkäterna är Google Formulär. Det blir allt vanligare att man använder sig av enkäter på internet, så kallade webbenkäter. Enligt Trost och Hultåker (2016) är webbenkäter ett mycket tidseffektivt sätt att genomföra en datainsamling, både i mån om billig distribution samt att man slipper registrera alla svaren separat.

Enkäten skickades ut i facebook gruppen ”studenter vid Högskolan i Skövde” med ca 4000

medlemmar. Detta med motivering att få så många svar som möjligt från en bred målgrupp. Vilket gör det till vad Trost och Hultåker (2016) beskriver som ett bekvämlighetsurval. Enkäten skulle kunnat publicerats i en grupp där det finns bilentusiasmer eller personer med intresse av interaktion för att därefter få in svar från en grupp som har kunskap om ämnet. Eftersom enkäten inte strävar mot varken kunniga/okunniga personer inom ämnet valdes en facebook-sida där relativt hög aktivitet förekommer. Enkäten besvarades av 51 respondenter. Vid framtagningen av enkäterna valdes det mellan olika format att ställa de olika frågorna i. Det kan vara avgörande för hur deltagaren svarar på frågan.

Det valdes mellan tre olika strukturer, den första strukturen handlar om att vara ute efter Ja eller nej svar, Exempelvis ”har du körkort? Ja/Nej (ett tredje förslag)”. I det här fallet finns det inget djupare svar, inga olika perspektiv, man vill enbart sätta in deltagarens svar i en kategori. Den andra

strukturen är användandet av påståenden i frågorna. Exempelvis ”Följande kommer olika påståenden där du ska klicka i vad som mest stämmer överens med din uppfattning, där 1 är ”håller inte alls med” och 5 ”håller med helt””. Trost och Hultåker (2016) menar att det positiva med denna struktur är att till skillnad från första kan personen sätta sin uppfattning mellan olika alternativ, i det här fallet en siffra som representerar deras känsla, om man inkluderar attityd-eller åsiktsfrågor i sin enkät svarar deltagarna olika, sedan måste man validera dessa frågor.

En nackdel är alltså att validiteten på datan riskerar att bli sämre om man ställer frågorna på fel sätt, reliabiliteten och generaliserbarheten påverkas beroende på vad deltagarna svarar på denna typ av struktur. Trost och hultåker (2016) menar att det är olika från person till person om man klickar i och

(17)

10

svarar exempelvis en 4:a. Eftersom personer tänker och fungerar olika, är det möjligt att vissa personer aldrig skulle besvara en 5:a i en fråga där 5 är max, då de alltid tänker en grövre situation.

Medan andra personer alltid kryssar i de lägsta och högsta siffrorna då de utgår från tankesättet att de antingen håller med påståendet eller inte. Den sista kategorin är då personen ska kryssa i olika områden. Fördelen här är att de kan välja flera olika kategorier och behöver inte prioritera en specifik, nackdelen är att data riskerar att gå förlorad då man inte får reda på varför de valde eller inte valde vissa områden.

Med dessa tankar gjordes en enkät med struktur 1 och 3. Strukturen med påstående som frågor valdes istället för fritext där deltagaren fått utveckla och motivera svar i tidigare frågor. En viktig åtanke till analysfasen av metoden var att få undersökningen att visa om personer med erfarenhet av röstsystem hade en mer positiv syn av det implementerat i ett fordon, jämfört med personer som saknar erfarenhet av röstinteraktion och tvärtom. Detsamma gäller gestinteraktion, om personer har fått använda gestinteraktion tidigare, skulle det påverka deras uppfattning av att behöva använda det som bilförare? Det vill säga utifrån ett holistiskt perspektiv, som Patton (2015) förklarar som då en studie inte ser saker som linjära och separata, utan att det finns möjlighet för en korrelation mellan de olika variablerna.

3.1.2 Intervju

Efter att enkäten var genomförd var det en aspekt som önskades fördjupas, nämligen självkörande bilar. Trost och Hultåker (2016) nämner att om man är intresserad av att till exempel försöka förstå människors sätt att resonera eller reagera, eller av att särskilja eller urskilja varierande

handlingsmönster är en kvalitativ studie rimlig. Enkäten fokuserade mycket på de två interaktionerna röst-respektive gest utifrån en bilförares perspektiv idag, därmed ansågs det finnas ett behov att undersöka hur personer uppfattar gestinteraktion i samband med självkörande bilar. 2 enskilda intervjuer genomfördes av mig via zoom mycket på grund av coronaviruset. De två intervjuerna var 07:12 respektive 09:33 minuter långa. I början av intervjun frågades deltagaren om de var bekväma med att intervjun spelades in via ljudupptagning på iphones applikation ”röstmemon”. Deltagarna befann sig i deras hem för en trygg känsla. Det förklarades för deltagarna att de kan avbryta intervjun när som helst om de känner för det och det beskrevs även vad datan från intervjun skulle bidra med.

Jag uteslöt beskrivande av vad studien handlar om för att inte påverka deltagarnas svar då intervjun är strukturerad utifrån att deltagarna inte har en större uppfattning om interaktionstypernas roll i studien. Däremot beskrevs studien mer detaljerat efter att intervjun var genomförd.

Intervjuens struktur (se bilaga 2) börjar liknande enkätens. Frågor om både röst och gestinteraktion finns för att säkerställa att båda deltagarna får samma grund till studien oavsett metod. Intervjun frågar sedan specifikt om vad respondenten har för åsikter om gestinteraktion. Sedan berättas ett scenario som beskriver en bil som är självkörande och vad respondentens roll i bilen kommer att vara. Efter scenariot frågas respondenten om den beskrivna miljön om självkörande bilar har ändrat åsikten om gestinteraktion inom fordon. Slutligen avslutas intervjun med att fråga om respondenten tror att röst-respektive gestinteraktion går att kombineras. Utifrån intervjun förväntas en möjlighet om att gestinteraktionens uppfattning kan ändras beroende på vad en bilförares roll i en bil är.

Intervjuerna transkriberades sedan i syfte att smidigare analysera datan.

3.2.3 Litteratur

Litteraturen använt i studien har upptäckts via följande databaser:

 Academic Search Elite

 ACM Digital Library

(18)

11

 Google Scholar

 HCI Bibliography: Human-Computer Interaction Resources

 IEEE Xplore

De sökorden för att identifiera relevanta källor var följande:

 Touchless interaction in cars

 Touchless interaction

 Interaction in cars

 Selfdriving cars

 Gesture interaction

 Voice interaction

 Gestinteraktion

 Röstinteraktion

 Top down and bottom up

Sökorden tillsammans med de listade databaserna gav en stor mängd relevanta artiklar. En avgränsning som gjordes i valet av litteraturen var att inte inkludera artiklar äldre än 2000-talet i förhållande till bilinteraktion. Detta på grund av att de interaktionstyperna relevanta i studien inte var relevanta tidigare än år 2000. Touchless börjades nämnas i litteratur under tidigt 2000-tal, även om det i vissa fall är spekulativt är det fortfarande relevant i den här studien då några aspekter inom röst-och gestinteraktion fortfarande är spekulativt. På så vis kan man se hur interaktionstyperna uppfattades då jämfört med idag. De valda artiklarna blev ett urval utifrån titlar, abstracts och introduktion. Några artiklar filtrerades bort då de saknade relevans. De som användes i arbetet ansågs relevanta då de diskuterar studiens frågeställning och syfte.

3.2 Forskningsetiska aspekter

Studien har utgått från de fyra huvudkraven från vetenskapsrådet gällande forskningsetiska aspekter, trots att det finns nyare versioner av dessa och de äldre har i vissa fall ersatts med GDPR var den äldre versionen fortfarande mycket relevant och går att använda. Dessa fyra huvudkategorier är informationskravet, samtyckeskravet, konfidentialitetskravet, och nyttjandekravet. I slutet av enkäten förklaras det att en deltagare kan kontakta mig som ansvarig för studien om de har några funderingar. Det är inte specifikt vilka funderingar som krävs för att deltagarna ska kunna nå ut till mig men tanken med det är att låta all typ av funderingar vara välkommet. Exempelvis om de har ångrat sig och inte vill att deras svar ska vara med i studien ska det gå alldeles utmärkt att be mig att ta bort svaret. I enkätens inledning förklaras syftet med enkäten och undersökningsdeltagarnas uppgift i projektet. Det uppmuntras att de får kontakta mig ifall de har några frågor och eller vill att jag tar bort deras svar.

Gällande samtyckeskravet, i enkäten förklaras det tidigt att en deltagares inskickade svar innebär att de godkänner villkoren och sättet datan behandlas. Eftersom enkäten enbart fokuserar på personer över 16 år ansågs det inte relevant att be om förälders underskrift i samband med aktivet deltagande från barn. Ingen har kontaktat mig för funderingar och eller frågor som exempelvis att de ångrat sig om deltagandet, men om det skulle ske är det viktigt att de inte utsätts för påtryck eller annat som kan påverka deras vilja att delta. Inte heller förväntas de få någon belöning av att besvara enkäten, utan är helt frivilligt och i gengäld utrycks min tacksamhet och studiens syfte.

I enkäten frågas det aldrig om uppgifter som kan avslöja identiteten på en specifik person såsom namn, däremot förekommer det frågor som ska ta reda på ungefär hur gammal personen är och om deltagaren är en man/kvinna alternativt annat. Dessa är enbart med eftersom studien har ett syfte

(19)

12

med resultatet från de frågorna. I frågan om hur gammal deltagaren är skrivs aldrig en specifik siffra utan de sätts i en åldersgrupp. Åldersfrågan har dessutom ett syfte med att undersöka om det skilljer sig åt på svarsalternativen mellan unga och gamla och isåfall vad. Dessa åtgärder har genomförts med Konfidentialitetskravet i åtanke, då inga individer ska kunnas identifieras utifrån deras svar. Om en deltagare däremot sträcker ut sig till mig och ber mig ta bort deras svar i enkäten kommer jag troligtvis få reda på något personligt såsom namn, telefonnummer eller mail, detta är däremot ett ovanligt fall och som nämnts tidigare inte har skett i studien.

Nyttjandekravet innebär att deltagarnas uppgifter inte kommer att användas i andra bruk såsom nya projekt eller icke-vetenskapliga syften (Vetenskapsrådet, 2002). Enkäten förklarar att deltagarens svar kommer att användas för att besvara studiens frågeställning och inget annat. Däremot ges det inte några detaljerade löften om vad resultatet inte kommer att användas till som isåfall skulle bryta mot nyttjandekravet. Med det sagt lämnar deltagare inga personlighetsuppgifter så studien kommer inte heller att påverka deras vardag på något sätt.

En viktig aspekt att tänka på är om någon grupp uteslöts i enkäten, eftersom enkäten handlar om frågor om röst och gestinteraktion är det tänkt att personer som kan genomföra den typen av aktivitet besvarar enkäten. Det finns personer i samhället som inte har möjlighet att tala eller personer som har förhinder att röra sig fysiskt vilket stoppar de från att använda gester i en

interaktion. Dessa personer kan däremot besvara enkäten då den är mycket spekulativ, med frågor såsom ”vilka områden SKULLE du som bilförare uppskatta att använda röstinteraktion?”. Med det sagt skulle en sådan persons svar kunna skilja sig från mängden då de har lite erfarenhet av att tala och därmed inte kunniga inom ämnet. Däremot frågar enkäten om personen har erfarenhet av röst och gestinteraktion vilket är i syfte att se om det skiljer sig i svaren mellan de som har erfarenhet och de som inte har det.

3.3 Analys och kompletterande undersökning

För att närmare undersöka scenarier med rattlösa självkörande bilar kompletterades enkäterna med intervjuer. En intervju har till skillnad från en enkät större möjlighet att gå in på djupet med

undersökningen och därmed ge ett kvalitativt perspektiv på undersökningen. Patton (2015) beskriver många fördelar med en kvalitativ undersökning, han skriver att om det genomförs rätt, det kan ge ett mer personligt perspektiv från en deltagare där ett samtal i form av en intervju kan ge rika och djupa svar. Detta förutsätter att intervjuaren är empatisk, har förberett intervjun och planerat strukturen på frågorna.

Borg & Westerlund (2012) skriver om olika analysmetoder och former, vilket resultatet av enkäten kommer att utgå från i analysfasen. Frågorna om röstinteraktionen kommer att analyseras med ett ickeparametiskt test, i det här fallet chi-två testet i korstabell. Enkäten inkluderar frågor där deltagarna kryssar i olika system i ett fordon för både röst-respektive gestinteraktion. Här vill man undersöka om det finns en signifikant skillnad på hur deltagarna valde mellan röst-respektive gestinteraktion. Chi-två testet inkluderar i det här fallet två variabler, där den ena är system och den andra är interaktionen.

Intervjun analyserades med hjälp av en bottom up analysen. Enligt Psyochologica (2010) handlar bottom up metoden att belysa vissa delar av information som anses vara det viktigaste, med den informationen kan man sedan få en uppfattning om helheten. I analysen av intervjuerna har olika citat valts ut, dessa citat är tänkt att representera deltagarnas uppfattning om ämnet frågorna beskriver. Citaten från intervjun delades sedan in i samma kategorier som datan från enkäten, det vill säga positiva och negativa åsikter. Till skillnad från enkäten fokuserade även intervjuerna på

(20)

13

kombinationen av interaktionstyperna samt scenariot med gestinteraktion i samband med

självkörning. I det här fallet finns det inga positiva och negativa kategorier, eftersom det endast var två intervjuer behövde inte generaliserade drag identifieras, istället lades relevant information från båda intervjuerna fram.

(21)

14

4 Resultat

I det här kapitlet presenteras resultat från enkätsvaren och intervjuerna. Först presenteras den kvantitativa datan och sedan den kvalitativa datan.

4.1 Kvantitativ data

 I enkäten på frågan ”jag har körkort:” svarade 88,2% att de hade körkort och 11,8% svarade att de inte hade det.

 I enkäten på frågan ”Jag har erfarenhet av röstinteraktion med system:” svarade 70,6% att de hade erfarenhet, 25,5% att de inte hade det och 3,9% svarade ”vet inte”.

I enkäten på frågan ”Jag har erfarenhet av gestinteraktion med system:” svarade 28% att de hade erfarenhet, 66% att de inte hade det och 6% svarade ”vet inte”.

Med enkäten undersöktes aspekter i en bil som bilister skulle uppskatta att använda röst och

gestinteraktion. Av totalt 51 respondenter i enkäten valdes 323 totala områden. Med ett Chi-två test med två variabler erhölls en signifikant skillnad mellan vilka aspekter av bilen som lämpar sig bäst för röst-respektive gestinteraktion, χ29=44,95 (p<0,001). Bilförare kunde tänka sig ha fler aspekter styrda med röstinteraktion än gestinteraktion, och överväldigande många fler såg inga

användningsområden för gestinteraktion i jämförelse med röstinteraktion (se figur 1).

Figur 1: Stapeldiagram. Stapeldiagrammet presenterar resultatet av vilka system som deltagarna i enkäten hade uppskattat att använda sig av med hjälp av röst-respektive gestinteraktion. Y-axeln är hur många personer som besvarade frågan, på x-axeln visas de olika systemen som fanns med i enkäten. Den blå stapeln visar antal svar för röstinteraktion och den orangea stapeln visar hur många som svarade gestinteraktion. Varje respondent svarade på detta för både röst-respektive

gestinteraktion.

4.2 Kvalitativ data

I enkäten (se bilaga 1) fanns det alternativ för respondenten att i fritext besvara vad de hade för åsikt om röst-respektive gestinteraktion. I det här underkapitlet presenteras frisvaren från enkäten.

Svaren är tagna från två olika frågor, fråga 7 och 10 som handlar om röst-respektive gestinteraktion.

Svaren från de båda frågorna kategoriseras utifrån positiva samt negativa synpunkter från

(22)

15

respondenterna. Respondenternas svar kommer läggas fram i form av citat. De nedan nämnda citaten är exempel på några av dessa respondenters tankar och åsikter kring gest- respektive röstinteraktionens och är menade att reflektera alla de 51 respondenternas svar för att ge en överblick över de generella åsikterna som finns bland svaren.

4.2.1 Röstinteraktion 4.2.1.1 Positivt

35 personer ansåg att röstinteraktion var någonting positivt, exempel på positiva svar är:

 ”Det skulle vara bra att med rösten kunna styra funktionerna för att slippa släppa blicken från vägbanan och körning. Jag tror att det kan minska olyckor, framförallt allt vid köbildning”

 ”Känns mer trafiksäkert att kunna styra detta via rösten istället för att knappa på utrustningen eftersom du också behöver titta på vilken knapps som trycks på. De andra alternativen görs antingen inte under färd eller behöver inte att föraren släpper synen på vägen för att ställa in”.

21 av de 35 respondenter som var positivt inställda till röstinteraktion lade fokus på smidigheten av den typen av interaktion, exempel på positiva svar med fokus på smidighet är:

 ”[…] Dock tror jag att jag skulle ha stor uppskattning för röstinteraktion inom de områdena jag fyllde i som tar upp större fokus från körningen så som tex navigation, där det ist känns både effektivare och snabbare att interagera genom röst än att manuellt styra det.”.

 ”Röststyrning för navigation och cruise control kan vara riktigt smidigt dock om det funkar väl. Att säga "kör i 70km/h" är smidigare än att smått justera med en lite knapp (som det var i min bil). Och för att knappa in en ny destination måste man stanna, för att det tar sån tid och uppmärksamhet.”

 ”Utvecklingen går framåt. Med hjälp av röststyrning utrustning gör vi det lättare och får mer tid med annat.”

 ”Jag tycker att kunna säga att t ex bagage ska öppnas inifrån bilen ifall någon vill lägga in något därbak i farten när du plockat upp någon om du har låst bagage är mycket smidigare än att behöva först låsa upp inifrån sen gestikulera att det är upplåst sen låta personen i fråga öppna bagage själv.”.

7 av de 35 respondenterna som var positiva för den typen av interaktion lade istället fokus på

säkerheten av att använda sig av röstinteraktion, exempel på positiva svar med fokus på säkerhet är:

 ”Jag tänker att allt som behöver göras när jag kör kan vara enklare med röststyrning, om den fungerar bra.”.

 ”Jag valde radio och navigation för att det känns säkrare att använda röstinteraktion då jag inte behöver pilla med mobilen medan jag kör”.

,4.2.1.2 Negativt

10 respondenter ansåg att röstinteraktion var någonting negativt, ett exempel på ett negativt svar är:

 ”Många moment sitter i ryggmärgen via spakar etc. Skulle vara konstigt att använda dessa med röststyrning.”.

5 av de 10 respondenterna med negativa svar fokuserade på säkerhetsrisker med användandet av röstinteraktion., exempel på negativa svar med fokus på säkerhetsrisker är:

(23)

16

 ”…tycker att de andra sakerna kan vara lite farliga att ändra med röstinteraktion under en körning. Speciellt om röstkommandot är något man kanske säger ganska vardagligt, och så kanske man pratar i telefon och så börjar fönster justera eller liknande. Kan bli lite klumpigt enligt min åsikt…”

 ”Hur ska jag kunna sjunga i bilen eller prata i telefon om jag riskerar att sätta på någon manick med bara min röst. För mig är detta en sådan sak där bara för att man kan, betyder det inte att man borde. Jag tycker om att köra bil, inte rymdskepp.”

 ”Detta beror lite på vart man kör (inom staden eller på motorvägen). Saker som skulle hjälp mig att utföra dem utan att behöva ta mina händer av ratten. Till exempel ringa någon eller sätta navigation. Känns lite läskigt att kunna reagera rätt på sätt i en nödsituation med röstinteraktion i ett självkörande moment. Med tanke på att muskelminnet är mycket snabbare än att försöka hinna tänka på situationen och röststyrda fordon.”.

8 av de 10 respondenterna fokuserade sina svar på teknikfel, exempel på negativa svar med fokus på teknikfel är:

 ”Min erfarenhet är att röststyrning fungerar tämligen dåligt…”, ”Röstinteraktionerna ser jag några potentiella problem om andra passagerare i bilen säger saker som kan justera cruise control, av misstag eller inte, så att bilen ökar eller sänker hastighet vid fel tillfälle. Samma sak med självkörande moment så kan någon möjligen stannar bilen på ett farligt ställe.

Röstinteraktioner kan historiskt sett tyda kommandon från helt andra, men ofta liknande ord, så det känns osäkert att låta sådana viktiga och farliga justeringar påverkas av en sådan teknologi.”

 ”Datorn måste vara bra synkroniserad med olika dialekter och uttal. Blir bara oerhört frustrerande om man säger en sak och "bilen" inte förstår.”.

2 respondenter fokuserade på att det skulle vara komplicerat med röstinteraktion, exempel på negativa svar med fokus på att det är komplicerat är:

 ”De alternativ som känns för komplicerade för röstinteraktion, såsom justera säten, känns som att det är bättre att utföra med händerna. Det blir lite jobbigt att säga varje steg i processen.”

7 respondenters svar gick inte att kategorisera som positivt eller negativt inställda till röstinteraktion, dessa kategoriserades därför som ”annat”. Ett exempel på ett svar som kategoriserades som ”annat”

är ”Det kändes rätt.” som en respondent gav som svar till frågan ” Motivera i fritext varför du valde de områdena du gjorde, om du inte valde några, motivera gärna varför. (Röstinteraktion)”.

4.2.2 Gestinteraktion 4.2.2.1 Positivt

8 respondenter ansåg att gestinteraktion var någonting positivt, exempel på positiva svar är:

 ”Jag tror dock att det finns möjlighetet att använda gestinteraktioner för en person som inte kan prata men eftersom jag inte är i den situationen är det svårt att svara på”

 ”Dehär områdena tror jag skulle kunna fungera bra med gestinteraktion då det inte krävs några mer specifika instruktioner (som vid Navigation, jag tänker att det kan vara svårt att ange en adress med gester). Gestinteraktion skulle också kunna fungera bättre än

röststyrning i tillfällen då rösten kan vara svår att uppfatta.”

 ”Till skillnad från frågan angående röstinteraktion anser jag att gestinteraktion passar bäst inom de områden där det ersätter tex snabba knapptryck (som tex för att justera fönster) […]”.

(24)

17

5 av de 8 respondenter som var positivt inställda till gestinteraktion lade fokus på smidigheten av den typen av interaktion, exempel på positiva svar med fokus på smidigheten är:

 ”Mesta dels för bekvämligheten men för att det skulle vara coolt”

 ”Till skillnad från röstkommandon, kan man tydligare förmedla hur mycket någonting ska justeras om det är en gradvis justering. Även om jag skulle vilja justera fönster via en liten spak, kan det vara trevligt att ha alternativet att kunna lägga handen på den nivå som man vill att fönstret ska vara så justerar den sig till det läget. Att justera säten kan vara obekvämt och krångligt att justera manuellt, att lägga handen där sätet ska vara låter smidigt. Att byta låt genom att sväva med handen höger eller vänster kan också funka fint […] Självkörande moment valde jag för att jag fick en rolig bild framför mig att köraren hastigt börjar peka med rak arm mot en avgång som hen snart åker förbi och säger ”uhh, ahh ,där, dit, ta höger!”, som en vanlig ”backseat driver”. ^^ Jag vill se den scenen. Det kan kanske även vara praktiskt att peka dit man vill ibland, om man inte kör manuellt d.v.s.”.

4.2.2.2 Negativt

25 respondenter ansåg att gestinteraktion var någonting negativt, exempel på negativa svar är:

 ”Man ska inte vifta och skit som förare”

 ”Försämrar bilen och ökar kostnaden”. 18 av de 25 respondenterna som var negativt inställda till gestinteraktion lade fokus på säkerhetsrisken av den typen av interaktion;

”Känns otryggt”

 ”Vill inte att man ska kunna hålla på och göra gester medan man kör, då det känns som en trafikfara.”, ”För gest ser jag bara problem. Händerna ska vara på ratten. Då återstår bara huvudet att gestikulera med och det ska vara still”

 ”Distraherande när det kommer till gester”.

5 av de 25 respondenterna som var negativt inställda till gestinteraktion ansåg att det var onödigt, ett exempel på ett negativt svar med fokus på att det är onödigt är:

 ”Som jag tidigare skrev, bara för att man KAN göra någonting för att det i teorin låter mycket bekvämare, BORDE man inte nödvändigtvis göra det. Det kan vara jag som är lite

gammalmodig med hur jag vill köra bil, men jag föredrar knappar och spakar då jag inte ser något fel med dem och därav har jag inte heller något behov av att byta ut dem. If it ain’t broke, don’t fix it.”

2 av de 25 respondenterna som var negativt inställda till gestinteraktion fokuserade på teknikfelen, ett exempel på ett negativt svar med fokus på teknikfel är:

 ”Om den krånglar och om man inte slå på den fast den körs igång ändå. Händer ofta med ex vis Google assistance. Till slut blir man stänga av den.” samt ”… Tänk om jag vinkar till någon utanför bilen och råkar ändra mina stolsinställningar mitt i trafiken. Det låter livsfarligt.

Förstår helt ärligt inte varför man det ska vara så svårt att trycka på en knapp eller dra i en spak för önskade ”beteendet” från bilen.”

12 respondenters svar gick inte att kategorisera som positivt eller negativt inställda till gestinteraktion, dessa kategoriserades därför som ”annat”. Ett exempel på ett svar som

kategoriserades som ”annat” är ”Har ingen erfarenhet och vet inte hur detta skulle kunna användas.”

som en respondent gav som svar till frågan ” Motivera i fritext varför du valde de områdena du gjorde, om du inte valde några, motivera gärna varför. (Gestinteraktion)”.

(25)

18 4.2.3 Intervjumaterial

2 intervjuer genomfördes utifrån en rad frågor (se bilaga 2). Frågorna i intervjun utgick mycket från samma aspekter som frågorna i enkäten. Däremot fokuserar intervjun mer på att fördjupa

respondenternas åsikter kring gestinteraktion i självkörande bilar samt ett kombinerat system bestående av röst-respektive gestinteraktion.

Resultaten från intervjun tyder på att gestinteraktion är mer uppskattat då en bilförare har en mer passiv roll än vad den traditionellt sett anses ha idag. En respondent som tidigare haft en allmänt negativ åsikt om gestinteraktion med aspekter såsom:

 ”Det kan vara en säkerhetsrisk att ta bort händerna så pass mycket från ratten och det kan leda till en distraktion mer än vad det hjälper till”.

Samma respondent svarade såhär på fråga 8 (se bilaga 2) efter att ha fått det självkörande bil- scenariot beskrivet till sig:

 ”Ja alltså i en sådan situation så hade det inte varit ett problem med att behöva göra saker samtidigt med händerna eller att man behöver ta bort händerna från ratten. Eftersom man inte behöver kontrollera bilen eller körandet på samma sätt som idag, så i ett sådant scenario kan gestinteraktion vara passande.”

Utöver detta såg man även i intervjun att bilförare kan tänka sig att kombinera röstinteraktion med gestinteraktion. På fråga 12 i intervjumallen som handlar om att kombinera röst och gestinteraktion svarade en respondent:

 “Det tror jag absolut är en bra idé. För jag tror att gestinteraktion känns väldigt svårt att applicera på till exempel om man vill berätta för bilen att jag vill ha en gps som visar mig vägen till den här platsen eller en adress eller om man vill ha ett långt namn på en låt eller vad som eller längre grejer känns det väldigt orimligt att bara göra det med gester. Ja, så att sådana enklare saker som att höja/sänka volym passar bättre med gester men att man även kan interagera med hjälp av röst […]“.

I enkäten svarade respondenter som var positiva till gestinteraktion att det kan vara smidigt att använda sig av gestinteraktion vid kortare kommandon. Detta tyder på att de olika interaktionssätten kan vara olika bra att applicera på olika områden och att ingenjörer och designers bör ta åt sig dessa åsikter.

References

Outline

Related documents

Angående FGS Ekonomi så kommer FGS-funktionen att ta kontakt med dels Ekonomistyrningsverket (ESV) dels de medarbetare som har gått vidare till Myndigheten för digital

• Standardisering och harmoniserng minimerar risken för dubbelarbete och skapar förutsättningar att återanvända specifika meddelanden vid utveckling av nya

Vi har i denna studie valt en ansats där syftet har varit öka förståelsen för faktorer som påverkar flickor med utländsk bakgrund att vara aktiva inom fotbollen och hur

Idrottslyftet är ett ekonomiskt medel som föreningar kan erhålla för att utveckla sin verksamhet i linje med den strategiska inriktning som Svensk idrott tagit beslut om,

Att välja kurser var relativt smidigt, det gjordes för höstterminen på senvåren innan avfärd genom att man mejlade sina kursval till University of Ottawa.. Informationen om detta

Slutsats: Då ingen statistisk signifikans påvisades innebär det att äldre personer med förmaksflimmer inte har mer smärta än personerna utan diagnostiserat förmaksflimmer.. Genom

Det man har lekt som barn ligger till grund för att utveckla kreativitet och skaparkraft som är viktigt genom hela livet.. Barn som leker och får utlopp för sitt rörelsebehov

- förvalta och vidareutveckla föreningens sportsliga riktlinjer - förvalta och förädla dokumentet Fotbollsutbildningen i Stuvsta IF - Vara en länk mellan verksamheten