• No results found

Ljuddesign för navigation: En undersökning om navigering i spel endast m.h.a ljud

N/A
N/A
Protected

Academic year: 2021

Share "Ljuddesign för navigation: En undersökning om navigering i spel endast m.h.a ljud"

Copied!
68
0
0

Loading.... (view fulltext now)

Full text

(1)

LJUDDESIGN FÖR NAVIGATION

En undersökning om navigering i spel endast

m.h.a ljud

NAVIGATIONAL SOUND DESIGN

A study in navigation in games with only

sound

Examensarbete inom huvudområdet Medier, estetik

och berättande

Grundnivå 30 högskolepoäng

Vårtermin 2020

Kurt Areskoug

Handledare: Anders Sjölin

Examinator: Jamie Fawcus

(2)

Sammanfattning

Studien visar huruvida ett ljudsystem, designat för att navigera en virtuell 3D-miljö utan visuell återkoppling, upplevs av användaren. En undersökning utfördes på tolv deltagare som testade detta ljudsystem i ett spel gjort för arbetet.

Spelet har designats från idéer baserade på tidigare forskning om inkludering, spel-och mjukvarudesign för blinda, samt studier om ljudperception spel-och ekolokalisering. Dessa har använts för att få en inblick i hur man, via ljud, kan ge nödvändig information till användaren. Olika ljud testades och modifierades inför de resulterande ljuden i spelet.

Datan hämtades via frågeformulär och skärmdumpar från speltestet. Frågorna som ställts har varit kopplade till upplevelsen av navigationen i spelet. Datan har även analyserats genom jämförelse mellan de olika deltagarnas resultat.

Resultaten har visat att ljudsystemet har varit funktionellt i att förmedla ndövändig information, med varierande upplevd svårighetsgrad mellan deltagare. Målet för framtdien är att förse spelutvecklare med fler verktyg att implementera inkluderande speldesign.

(3)

Innehållsförteckning

1 Introduktion...1

2 Bakgrund...2

2.1 Inkludering...2 2.2 Ljudperception...4 2.3 Ekolokalisering...7

2.4 Verktyg och spel för blinda...8

2.5 Design av mjukvara...10 2.6 Sammanfattning/Artefakt...11

3 Problemformulering...13

3.1 Metodbeskrivning...14

4 Genomförande...19

4.1 Research / Förstudie...19 4.2 Process...19 4.3 Förstudie...30

5 Utvärdering...36

5.1 Presentation av undersökning...36 5.2 Analys... 36 5.3 Slutsatser...49

6 Avslutande diskussion...53

6.1 Sammanfattning...53 6.2 Diskussion...53 6.3 Framtida arbete...55

Referenser...56

(4)

1 Introduktion

Navigation i dataspel görs i kombination av information från ljud och det synliga. När det visuella inte ger tillräckligt med information, som t.ex vid spel med förstapersonsperspektiv, används ljud för att få information om sin omgivning. I bakgrundskapitlet tas det upp information som studien bygger på. Bl.a studier där spel gjorts för inkludering av blinda spelare. Fynden i de studierna har gett idéer som hjälpt till att bygga artefakten för denna studie.

Denna studie är centrerad kring ett spel i en 3D-miljö som endast navigeras med hjälp av ljud. Navigationssystemet liknar verktyget byggt av Loomis, Golledge och Klatzky (1998) där målets position “hörs” i relation till spelarens position. Detta arbete ämnar att hitta

förståelse i hur man kan implementera ett ljudsystem för att främja spelarens navigation utan visuell hjälp.

Tolv deltagare medverkade i undersökningen. Deltagarna i studien fick först vänja sig vid spelets mekanik och sedan påbörjades testet av en spelsekvens. Datan som analyseras hämtas ut via skärmdumpar av spelsekvensen, samt frågeformulär där det framkommer information om deltagarna, deras spelvanor, hur användbart ljudsystemet är, samt upplevelsen av navigationen för de individuella deltagarna.

(5)

2 Bakgrund

Många spel använder ljud för att ge viktig information till spelaren. Ljud från fiender

informerar spelaren om att det finns en fara i närheten, eller att fienderna gör någonting som spelaren bör uppmärksamma. Ljud från spelarens avatar informerar spelaren om avatarens tillfälliga tillstånd som trötthet, hälsa, rörelse etc. Dessa ljudhändelser är dock oftast

kopplade till visuella händelser, vilket förstärker och bekräftar informationen som spelaren får från ljudeffekter.

Vilken information återges till spelaren när det visuella tas bort från spelet? I ett spel som endast ger information via ljud, finns det möjlighet att spelet fortfarande är spelbart, och även underhållande?

Intresset för en studie inom detta område finns i att se hur mycket värdefull information ljud kan ge spelare vid navigering av en spelmiljö.

För att testa detta så har ett spel gjorts med fokus på navigering i en 3D-miljö, där målet är att hitta slumpmässigt utsatta målpunkter i miljön. Spelet ger ingen visuell information till spelaren (förutom vid menyval), istället ligger utmaningen i att använda sig av

informationen från ljuden och mekaniken i ljudsystemet för att navigera miljön och hitta målen på det snabbaste möjliga sättet.

2.1 Inkludering

För att inte exkludera en grupp av användare via design och istället inkludera en annan grupp, behövs bra planering och speldesign för att lyckas. Målet med en studie utförd av Wilhelmsson, Engström, Brusk och Östblad (2017) var att inkludera spelare med nedsatt syn i att kunna dela en spelupplevelse med seende spelare. Spelupplevelsen i fråga var narrativet i ett spel de designade för studien. Spelet designades så att de aspekter som inkluderade de med nedsatt syn ej exkluderade seende spelare.

Spelet som gjordes var ett äventyrs- “point-and-click” -spel. Menyer gjordes enkla att navigera för både seende och personer med nedsatt syn, utan att designen inkräktar eller ta spelarna ur immersionen, därför undveks “text-to-speech”-funktioner (syntetiska röster) då dessa ej är vardagliga för seende. Istället används ljuddesign för att göra navigationen intuitiv för alla, t.ex. om spelaren drar fingret och närmar sig ett interaktivt objekt så “hörs” objektet närma sig i ljudbilden från det håll den är i relation till fingret.

(6)

Deltagarnas prestation mättes i hur pass långt deltagarna kom i spelet och sedan i en intervju mättes deras förmåga att återberätta händelserna i spelet. Studien visade att det finns möjligheter att ha en speldesign som tillåter en delad spelupplevelse mellan dessa grupper.

Kritik kan ibland vara befogad mot spelutvecklare när det kommer till hur få spel det finns just nu som är inkluderande, det hävdar i alla fall Giannakopoulos G., Tatlas,

Giannakopoulos V., Floros & Katsoulis (2018) i sin artikel om tillgänglighet inom

elektroniska spel för blinda och unga spelare. I artikeln nämns även nuvarande ljudspel, s.k. “audio-games”, som antingen är för enkla eller för gamla för att kunna erbjuda spelaren en fängslande spelupplevelse. Artikeln vill även trycka på vikten om varför inkluderande spel är en viktig komponent för yngre personer, och hävdar att spel fungerar som en gemensam grund, en slags mötesplats för personer med och utan några som helst funktionsvariationer. En konsekvens av att uteslutas, menar experter som Giannakopoulos, G. et al. (2018) refererar till, kan leda till alienation. Det tas även upp att spelare som “endast” är gravt synnedsatta, men inte blinda, vill kunna använda sig av den syn som de ändå besitter. Utifrån intervjuer med 38 olika respondenter fann de att vägledning är en mycket vital del för blinda och unga spelare, och att ha en allierad AI vid sin sida täcker den efterfrågan på ett intuitivt sätt. Den allierades inblandning skulle på så vis höja spelupplevelsen genom att exempelvis vägleda spelaren genom en övningsbana, menar artikeln. Forskarna lyfter även fram en viktig poäng i att utveckla inkluderande lärande spel, så att studenter även

motiveras att fortsätta lära sig även utanför skoltimmarna. Blinda studenter får då i den meningen även chans att spela dataspel på sin fritid, vilket har efterfrågats bland annat i artikeln skriven Rodríguez, Boada och Sbert (2018). Ytterligare en fördel som

Giannakopoulos, G. et al. (2018) nämner i artikeln är att genom främjande av utbildande spel, i största allmänhet leder till att eleverna kan arbeta över hela läroplanen, och utbildar sig inom flera ämnen parallellt med varandra.

M. Hersh och B. Leporini (2018) skrev en ledare som handlade om inkludering för

funktionsvarierade personer i lärande spel. De uttrycker att lärande spel är en marknad som är hastigt växande, och som används av fler och fler instanser, samtidigt som författarna påpekar vikten av att inkludera studenter med funktionsvariationer i de nya metoderna för inlärning. Författarna menar att spel i dagsläget har i stort sett fokuserat på den population som inte lider av något handikapp, istället för att designa spel så att de kan passa in på alla funktionsvariationer. Många spel kräver en snabb reaktionsförmåga, vilket blir ett naturligt hinder hos den nuvarande spelmarknaden för personer med exempelvis nedsatt syn (M, Hersh & B, Leporini. 2018). Exempel på populära spel just nu bland ungdomar i övre

(7)

tonåren, enligt Statens Medieråd (2019) är League of Legends (2009) och Fortnite (2017), som båda kräver snabba reflexer och spelas av miljontals användare världen över.

Hershs och Leporinis (2018) inledande resultat visade på att lärande som är kul,

tävlingsinriktat och kretsar kring samarbete motiverar studenterna att lära sig mer effektivt. En snabb och specifik feedback underlättade för eleverna att lista ut det rätta sättet att lyckas i dessa spel. Resultaten visade också på ett behov av att ge (bl.a.) lärare de rätta verktygen så att de kan utforma deras egna versioner av lärande spel. Detta kan göras för att

specialanpassa spelet, exempelvis för elever med speciella behov. Exempel som tas upp i artikeln på utbildande spel, är spel som främjar social interaktion på en lekplats.

Tanken med just detta spel var att elever med autism kunde träna sin sociala förmåga och motiveras till att delta i fler sociala sammanhang utanför dataspelet. En annan typ av lärande spel som exemplifieras är spel som ska förbättra flexibiliteten i sitt tankesätt i en

neuropsykologisk rehabilitering. Detta kan tillämpas på personer som exempelvis är

hemkomna efter en stroke och behöver nya vägledningar i vardagliga situationer (M, Hersh & B, Leporini. 2018).

2.2 Ljudperception

Andersson och Casey skriver om hur ljud upplevs i 3D-miljöer (Anderson, D & Casey, M. A. 1997) samt hur man kan arbeta för att få ljuden att låta trovärdiga i 3D-miljöns kontext. För att ett ljud ska låta trovärdigt för miljön den befinner sig i bör reflektionerna i miljön

överensstämma med hur det ljudet hade agerat i verkligheten, exempelvis en klapp i en konsertlokal ger flera reflektioner som håller på länge, kontra en klapp i en garderob där reflektionerna blir korta och få.

De beskriver Head-Related Transfer Function (HRTF) och användning av det inom VR, där det används för att simulera ljudets riktning i en 3D-miljö genom att simulera hur ett huvud tar upp ljud t.ex. ett ljud från vänster hörs först i vänster öra och sedan i höger öra. Detta tillsammans med virtuell akustik gör miljön mer trovärdig för användaren då det är mer likt hur en människa brukar uppfatta ljud. Med virtuell akustik menas en simulering av verkliga akustiska rum/ytor, så att reflektionerna överensstämmer med miljön.

I studien framförd av Kolarik, Moore, Zahorik, Cirstea och Pardhan (2016) skriver de att en person som har gravt nedsatt syn också har en berikad lokaliseringsförmåga med hjälp av ljud, framförallt när man pratar om ljud inom det märkbara området hos en person. Kolarik et al. (2016) undersöker distansförhållanden i ljud och dess effekt av sensorisk förlust. Författarna skriver att man i snitt överskattade längden till ett ljud vars källa befann sig

(8)

inom personens räckvidd och underskattade längden till ett ljud vars källa befann sig utanför den personliga räckvidden.

Artikeln (Kolarik et al. 2016) beskriver svårigheter för blinda personers sätt att förhålla sig och bedöma avstånd till ljudkällan. Detta beskrivs i artikeln bero på att blinda inte kan “kalibrera” sin hörselperception på samma sätt som en seende person kan göra. Någonting som kan påverka den upplevda distansen på ett ljud kan också ha att göra med personens sinnesstämning, exempelvis om man är rädd, så kan det ha en inverkan hur man uppfattar distansen till ljudkällan (Kolarik et al. 2016). Artikeln nämner även en undersökning där man testade detta fenomen. I undersökningen skulle deltagarna sträcka ut handen och nå ett föremål, varpå de respondenterna som befann sig i ett uppskrämt tillstånd inbillade sig att föremålet var närmare deltagaren än de personer som befann sig i ett fridfullt

sinnestillstånd. På liknande sätt skriver även författarna om en annan undersökning där det uppvisades ett mönster där uppskrämda personer upplevde ett ljud som mer högljutt än personer som istället var lugna.

Kolarik et al. (2016) skriver också om svårigheter som blinda upplever när det kommer till hantering av trafik. I denna uppgift så jämförde man blinda och seendes beteende när de skulle gå över en trafikerad väg. Vid jämförelser mellan blinda och seende deltagare märkte man ett mönster där blinda medverkande var långsammare på att bedöma situationer, färre tillfällen togs när en person faktiskt hade tid att ta sig över vägen. Dessa mönster var särskilt synliga när det var mycket bakgrundsljud från annan trafik, vilket gjorde det svårt att

urskilja när en bil närmade sig respondenten.

En studie visar att perioder med lägre volym i trafikens ambience leder till färre beslut med riskfyllda korsningar (Dae Shik Kim, Emerson, R. W., Naghshineh, K. and Myers, K., 2014). Denna studie var uppdelad i två delar, den första där man mätte ljudvolymer under en period på ett antal olika korsningar, och den andra där man lät 14 deltagare med nedsatt syn utföra olika experiment där respondenten skulle ge information om trafiken via en radio kontroll. Vid korsningar utan signalljus skulle deltagarna meddela via en knappsats när de skulle påbörja korsning av vägen (genom att hålla inne knappen) tills de inte längre skulle gå ut på gatan (genom att släppa knappen). Dessa resultat jämfördes sedan mot en seende experimentators beslut att korsa eller inte, för att bedöma riskfaktorn i deltagarnas beslut. Vid korsningar med signalljus skulle deltagarna trycka på knappen när de hörde första bilen i den parallella korsningen börja röra på sig, och sedan trycka på vänster eller höger knapp för att indikera ifall bilen körde rakt fram respektive gjorde en sväng.

(9)

Studiens resultat visar att deltagarna tenderade att göra mindre riskfyllda beslut vid lägre kontra högre ljudnivåer i ambiensen. Dock visar det inte på ifall deltagarna upptäcker kommande bilar bättre under tystare ambience-ljudnivåer eller ifall deltagarna uppfattade tystare tillfällen som generellt säkrare att korsa en väg. Alternativt är att vid ambience med lägre volym, desto enklare var det för deltagarna att uppfatta ljud med lägre intensitet. De skriver vidare att resultaten generellt är konsekventa med hur orientering och

mobilitetsträning lärs ut till personer med nedsatt syn vid korsning av dessa typer av gator, genom användning av tysta perioder eller luckor i trafiken.

I studien framförd av Lokki och Gröhn (2005) har de skapat ett spel för att testa navigation i en virtuell 3D-miljö. De testar visuella, ljudliga och audiovisuella signaler för att hjälpa spelarna att hitta målpunkter i 3D-miljön. När de beskriver deras val av ljud för navigationen skriver de: “A pink noise burst has a wide spectrum and temporal variation, both of which are important cues for localization.” Ett kort ljud som är rikt på frekvenser hjälper spelaren att lokalisera ljudkällan. Denna idén utvecklar de vidare genom att göra olika varianter av pink noise som ändras i: volym, volym och upprepningshastighet, volym och tonhöjd samt en kombination av alla dessa. Resultaten visade att de varianter som liknades mest vid resultaten för visuella signaler var de som använde sig utav volym och tonhöjd. Detta förenklade för deltagarna att hitta målen i höjdled.

Personer med nedsatt syn har fall där de använt sig av ekolokalisering för att navigera utrymmen. Vijay K. Gidla (2016) skriver om detta i en masteruppsats som jämför ifall blinda och seende kan nyttja ekolokalisering och hur pass bra de kan använda den informationen. Tesen Gidla ger är följande: 1. Hitta den akustiska informationen som styr blindas höga lokaliseringsförmåga. 2. Hur denna akustiska information som visar hög

eko-lokaliseringsförmåga hos de blinda kan representeras i det mänskliga auditiva-systemet. Författaren berättar om de tre beståndsdelar som är relevanta för ljudperception: Högljuddhet, tonhöjd och klangfärg.

Gidla skriver att frekvenser över 2 khz ger lokaliserings-information om ett objekt, och lägre frekvenser används för att bedöma storleken på objektet. Detta testades genom att spela upp ett ljudklipp i olika längd i olika rum framför en reflektiv yta som sedan spelades in av mikrofoner med binaural teknik. Resultaten analyserades efter tonhöjd, klangfärg och högljuddhet. Gidla avgränsar ljudens komponent-områden från tonhöjd till repetitions tonhöjd, vilket är tonhöjden på reflektionen av ljudet. Klangfärg avgränsas till ljudets skarphet.

(10)

2.3 Ekolokalisering

Ljudet studsar olika beroende på vilken miljö man som lyssnare befinner sig och var källan till ljudet spelas upp någonstans i världen. Detta är en viktig komponent vid implementering och design av ljud, speciellt för spel med 3D-miljöer. Kolarik (Kolarik, A. J. et al. 2016) tar upp i sin studie att i ett ekofritt rum, så förfaller ljud med 6 decibel (dB) för varje fördubbling av distans mellan ljudkällan och ljudupptagare. Detta sker dock aningen långsammare beroende på efterklangen i rummet. Författarna beskriver också att beroende på hur ljudkällan “utstrålar” ljudet så kan det ha en avgörande faktor för bortfallet av dB. Exempelvis om ljudkällans ljud strålar ut som en slags glob eller mer som en stråle så påverkar även detta. Ett efterklang i ett ljud minskar inte lika hastigt i dB i förhållande till avstånd, utan beräknas med ca 1 dB per fördubblad distans till ljudkällan (Kolarik, A. J. et al. 2016). Artikeln hävdar också att blinda personer inte har någon märkbar fördel när det kommer till att bedöma avstånd och riktning på en ljudkälla.

Gidlas (2016) studie innefattade deltagare som var både seende och personer med nedsatt syn och jämförde resultaten. Dessa visar på att högljuddhet är en viktig komponent i

ekolokalisering, samt att de blinda deltagarna klarar av att med lägre volym ekolokalisera än de seende deltagarna. Detsamma gäller för tonhöjdsinformation (pitch information), blinda har användning av den informationen tidigare än seende. Dock är det otydligt hur

uppfattningen av tonhöjdsinformation skiljer sig mellan seende och blinda, men Gidla (2016) antar i sin artikel att den inkodade informationen i tonhöjd är densamma för blinda och seende. Skarpheten på ljuden ger information, men ju skarpare ljud desto mer

tonhöjdsinformation innehåller de, vilket gör det svårt att tyda vilken information som är mest användbar i ekolokalisering. Studien visar även att rumsakustiken har en betydande roll i kvalitén av ekolokalisering.

Sammanfattningsvis så visas det att repetitionstonhöjd samt högljuddhet tillför viktig information för ekolokalisering vid kortare distanser, och skarphet kan ha användbar information vid både kortare och längre distanser, även om vidare studier på skarphet krävs för att kunna dra några konkreta slutsatser.

Slutsatser som görs av Gidla (2016) är att användbar information för ekolokalisering hittas från repetitionstonhöjd, högljuddhet och skarphet för kortare distanser, samt att skarphet även har potentiell användbarhet för längre distanser vid ekolokalisering. Då båda

deltagargrupperna (blinda och seende) analyserades efter samma auditiva modeller antar Gidla (2016) att blindas förbättrade ekolokaliseringsförmågor beror på deras förstärkta perceptuella förmågor. Dock är det viktigt att notera att experimenten utfördes under

(11)

statiska förhållanden, och att ekolokalisering används praktiskt under dynamiska förhållanden som t.ex. under rörelse.

2.4 Verktyg och spel för blinda

Studien gjord av Merabet, Connors, Halko och Sánchez (2012) berättar hur en Audio-based Environment Simulator (AbES) utformad efter en verklig miljö, kan användas för att lära ut blinda spelare att navigera i den miljön utan att aldrig fysiskt varit närvarande i den innan. I studien testar de två olika grupper av tidigt blinda deltagare. I den ena gruppen fick

deltagarna navigera den virtuella miljön i ett action-spels kontext, och den andra gruppen som fick en genomgång av miljön på en förutbestämd rutt. Sedan togs deltagarna till den verkliga byggnaden som den virtuella miljön var byggd utefter, där de fick utföra olika uppgifter baserade på navigering av miljön. Uppgiften i den fysiska miljön var att bl.a. hitta snabbaste utgången från slumpmässigt valda start-positioner.

Resultaten av studien visar att spatial information är överförbar från den virtuella miljön till den riktiga. Studien visar även att deltagarna som fick spel-varianten fick bättre resultat än den grupp som blev navigerad. Detta visar även att inlärning i ett spel-kontext ger en mer mångsidig mental kartläggning hos användarna som är flexibel för att kunna lösa de problemen som är givna. Detta resulterade i att de som spelade spelet generellt hittade den kortaste sträckan och hade kortast tid.

I en fortsättning av denna studie har Connors, Merabet, Chrastil, och Sanchez (2014) utvecklat idén vidare med inlärning av miljöer och hur en användare kan dynamiskt manipulera sin mentala kartläggning av miljön, vid spontana ändringar av uppgiften i miljön. Exempelvis: Spelet är utformad i en AbES, vilket är baserad på att navigera med endast hjälp av ljuddesign. I spelet är målet att plocka upp ett antal slumpmässigt placerade juveler i en flervåningsbyggnad med olika rum och även undvika fiender som tar juvelerna från spelaren och sedan lägger ut dem slumpmässigt i byggnaden. Nästa steg i studien var att låta deltagarna, utan förkunskap, navigera i byggnaden AbES-miljön var utformad efter, där deltagarna skulle utföra två uppgifter. I den första uppgiften skulle deltagarna navigera enligt tio slumpmässigt presenterade förutbestämda banor. Dessa kunde gå mellan våningar eller befinna sig på samma våningsplan. I den andra uppgiften blev deltagarna placerade på tio slumpmässigt utvalda positioner där de skulle hitta snabbaste vägen ut ur byggnaden. Resultaten visar att utforskandet av en AbES ger en bra och säker miljö för användare att träna och utveckla rumsliga kognitiva färdigheter i relation till mål-byggnaden som AbES-miljön är utformad efter. Connors et al. (2014) skriver även om möjligheten att inlärningen via ett actionspel ledde till en mer stabil mental karta som leder vidare till mer flexibel

(12)

manipulering av den spatiala informationen. Detta teoretiserar de att ha lett till en förstärkt kontextbaserad inlärning och överföring av den situationella kunskapen i relation till ett bättre förstående av byggnadens spatiala inter-relationer. De märkte även att ju bättre deltagarnas prestation i spelets utforsknings-mål, desto bättre blev den erhållna spatiala kunskapen som sedan överfördes till verkliga världens navigationsuppgifter.

I ett försök att utveckla ett navigationssystem för blinda har Loomis, Golledge och Klatzky (1998) gjort en studie där de lät olika deltagare med nedsatt syn testa deras system, som de sedan mätte resultaten på. Systemet var byggt via en dator i en väska uppkopplad till ett geografiskt-nätverk där forskarna hade detaljerat kartlagt närliggande områden (vägar, gångbanor, cykelbanor, träd, byggnader etc.). Detta är sedan kopplat till hörlurar som användaren har på sig samt en kompass som antingen sitter på huvudet eller i väskan (beroende på val mellan fyra olika navigationsvarianter). Allting är sedan kopplat till en “akustisk display” för att tillåta användaren att navigera menyer för systemet utan att behöva se dem.

Syftet med studien var att se hur spatialt ljud skiljer sig i resultaten från verbala kommandon (exempelvis GPS-“instruktioner”). Deltagarna fick pröva olika varianter och sedan blev de frågade vilken variant de föredrog. De flesta deltagarna föredrog varianten där systemet säger vart nästa vägpunkt är genom att ha ett ljud för det i 3D-ljud miljön (exempelvis “point one” spelas upp i vänster öra om punkten är vänster om användaren). Detta systemet är även ämnat att ge information om närliggande objekt som inte är nödvändigtvis

slutdestinationen, exempelvis närliggande byggnader eller andra objekt.

Ett alternativt sätt att tackla navigeringsproblem i dataspel är med hjälp utav en fysisk vit käpp, likt de som personer med gravt nedsatt syn använder i vardagen. Rodríguez, Boada och Sbert (2018) skapade en hårdvara som hanteras likt en vit käpp, men var kopplad till datorn för att interagera med spelet. I deras studie så utformade man en virtuell 3D-miljö där tolv blinda testpersoner fick möjligheten att utforska världen med hjälp av denna Arduino-baserade hårdvara. Forskarna fick positiv respons från de synnedsatta testpersonerna, kring sin tillverkade hårdvara.

Verktyget som togs fram kan opereras med en hand för att föras fram och tillbaka i sidled. Vid änden av den vita käppen sitter sensorer som stöter i kanterna i trä-riggen. Beroende på var någonstans i den uppkopplade virtuella 3D världen som spelaren befinner sig, så avger staven olika ljud som avspeglar ytorna som träffas i spelet. Artikeln beskriver att den vita käppen även kommer med vissa fysiska hinder, såsom räckvidd och att hitta hinder ovanför knähöjd. Nyare versioner av käppen utvecklades, bl.a. med sensorer och ett responssystem för användaren. Dock, menar författarna, så kan dessa utvecklingar eventuellt leda till

(13)

kognitiv överbelastning för den blinda användaren, vilken gör den extra informationen oanvändbar.

2.5 Design av mjukvara

Som utvecklare bör det finnas intresse att utöka sin målgrupp. Man kan tänka sig att om fler kan ta del av din produkt, desto bättre är det, inte bara utifrån ett ekonomiskt perspektiv, utan även sett ifrån utvecklingsmöjligheterna som det innebär. En empirisk studie där man går igenom olika designval som sedan utvärderas med hjälp av kvalitativa intervjuer som utfördes på personer med nedsatt syn av olika grader (Chakraborty, J., Chakraborty, S., Dehlinger & Hritz 2017). Generellt sätt lärde man sig från denna studie vikten av respons från ljud när spelaren tryckte på knappar, samt vissa problem som man kan koppla till navigationen i den virtuella 3D-miljön. Exempelvis så ansåg respondenterna i studien att någonting som kunde förbättra deras upplevelse markant är spelarens upplevelse av orientering, upphöjd spatial upplevelse samt respons beroende på spelarens

knapptryckningar.

Ett tillvägagångssätt för att enklare anpassa mjukvara till personer med nedsatt syn är att använda verktyg de redan är vana vid, och designa mjukvaran runt verktygen. Detta påpekar Rodríguez, Boada och Sbert (2018) i deras studie där de utvecklade hårdvara för efterlikna den vita käppen. De anser att detta kan vara ett verktyg som man mycket väl kan använda sig av vid tillverkning av ett spel för blinda som kretsar kring navigering och utforskning.

Samtliga personer som ingick i denna studie använde sig av vit käpp till vardags, vilket kan ha lett till viss hjälpande igenkänningsfaktor, då endast drygt 17% av respondenterna spelade dataspel i dagsläget när studien utfördes. Gruppen som testades här är dock alldeles för liten (12 deltagare, varav 6 st kvinnliga och 6 st manliga) för att kunna göra en övergripande bedömning som talar för den generella personen med nedsatt syn. Däremot så var efterfrågan av att kunna spela dataspel relativt stor (83.3%) (Rodríguez, Boada & Sbert . 2018).

För att smidigt kunna navigera en miljö måste användaren veta var de är och även veta var deras slutdestinaition är. För att enkelt kunna känna igen sig i en miljö kan man använda sig av ambience eller musik, detta visas av studien gjord utav Ardito, Costabile, De Angeli och Pittarello (2007). Syftet med studien var att se ifall ambience eller musik kunde påverka användarens navigering eller igenkänning av olika virtuella miljöer (museums webbsidor där de fick olika navigerings uppgifter). Resultaten av studien visar att när användarna var informerade av musikens funktion för att navigera de olika miljöerna ökade prestationen avsevärt mycket, dock hade de icke-informerade användarna svårare att navigera miljön.

(14)

Studien visar på att en välplanerad ljudmiljö och information till användarna om ljudmiljöns funktion kan minska förvirring hos användarna, och hjälpa navigering i den virtuella miljön. I teorin skulle man även kunna vidareutveckla liknande studier så att de kan appliceras i praktiken. Detta skulle kunna utformas efter Khan och Khusros (2019) förslag till

standardisering för blinda personers gränssnitt. Denna standardisering menar att förenkla gränssnittet för applikationer på smarttelefoner genom att tillhandahålla ett gränssnitt för blinda som tillåter de att skräddarsy gränssnittet efter kontext, layout och

interaktionsmönster (röst, haptisk, berörning etc.).

Målet är att ge blinda personer en konsekvent typ av gränssnitt och på så vis underlätta för dessa personer när det kommer till att lära sig nya program som tar efter detta förslag. Artikeln (Khan, A. Khusro, S. 2019) tar även upp vissa hjälpmedel för mobila enheter och dylikt, som också strävar till att hjälpa personer med nedsatt syn. Ett sådant exempel är haptisk återgivning, alltså när användaren stimuleras med hjälp av känseln. Ett exempel på haptisk återgivning är när en speldosa vibrerar då någonting speciellt händer i den virtuella världen. Medverkande i denna studie fann stor glädje i den mer standardiserade, förenklade versionen av gränssnittsdesign, vilket tyder på en viss typ av efterfrågan när det kommer till gränssnittet hos nyskapade mjukvaror.

I artikeln skriven av Schär och Krueger (2000) beskrivs aspekter man bör ha i åtanke när man använder sig av nyare tekniker i multimedia för inlärning. Bland annat bör man tänka på hur innehållet i mjukvaran lever upp till färdigheterna hos användaren, så att

interaktionen blir användbar och underhållande. Har mjukvaran en teoretisk bakgrund, vilken/vilka plattformar är lämpliga för just denna produkt, vilka är målgruppen och vad har dem för förväntningar (Schar, S. G. & Krueger, H. 2000)? Författarna skriver också att lärande inte bör vara tråkigt och seriöst, utan istället spännande och roligt, vilket man kan uppnå med exempelvis datorhjälpmedel för lärande. Artikeln beskriver att unga personer är vana datoranvändare, vilket sätter dem i en familjär situation där de själva kan justera inlärningskurvan efter personlig smak och tycke när man hanterar en lärande mjukvara. Motsatsen kan dock ske för äldre användare, då skepticism av ny teknik snabbt kan bilda en slags kraftig inlärningskurva för användaren (Schar, S. G. & Krueger, H. 2000).

2.6 Sammanfattning/Artefakt

Denna forskning ger en inblick i hur den del av befolkningen som inte kan förlita sig på sin syn, kan använda sig av olika mjukvaror som spel, samt hur dessa bör designas för att de ska effektivt kunna använda mjukvaran. Då de med nedsatt syn får mycket information av just ljud, kan dessa studier även visa hur man effektivt kan använda ljuddesign som ett pålitligt

(15)

informationssystem för användare av mjukvara. Vid jämförandet av studierna av Gidla (2016) samt Rodríguez, Boada och Sbert (2018) har jag kommit fram till att man kan med hjälp av ljud bedöma avstånd till ett objekt samt bedöma storleken på objektet, även genom att stöta till det med exempelvis den vita käppen.

Detta arbete använder sig av informativa ljud, vilket är ljud som ger information till användaren om miljön de befinner sig i. Ett exempel på dessa finns i studien av Lokki och Gröhn (2005) där de använder sig av ljud som ger information till spelaren om målet de försöker navigera till med hjälp av ljudet.

Då större delen av spel använder sig av navigering som grundmekanik för spelet, fokuserar denna studien på att göra ett spel som är helt baserad på navigering utan visuell

återkoppling. Med dessa studier i åtanke har en artefakt skapats i form av ett spel, där grundmekaniken innefattar navigation i en virtuell 3D-miljö, i förstapersonsperspektiv, med endast hjälp av ljud. Spelarens mål är att hitta specifika målpositioner som indikeras av ljud som avges från målen när spelaren står still. Dessa ljud hörs i stereobilden och det är upp till spelaren att via informationen som ges via ljuden, navigera miljön till målet.

(16)

3 Problemformulering

Artefakten som utformats för studien var ett spel där navigationen var i fokus, där spelaren med hjälp av endast information från ljud, försökte uppnå målet. Utmaningen med spelet var att hitta fem slumpmässigt utplacerade målpositioner i en 3D-miljö, där målen avgav ett ljud i stereobilden som endast lät när spelaren stod still.

Wilhelmsson et al. (2017) visade i sin studie att möjligheten att göra spel som inkluderar både blinda och seende är en möjlighet, detta som Giannakopoulos, G. et al. (2018) menar är en viktig del för att inte utesluta blinda från sociala sammanhang.

För att få en verklighetstrogen ljudbild behövs att ljuden i spelmiljön agerar på ett sådant sätt som efterliknar hur ljud agerar i liknande miljöer i verkligheten, vilket är något som påpekas av Anderson & Casey (1997). Detta behövs för att kunna undvika hindren i spelet, som t.ex. trafiken. Trafikljud bör vara tydliga genom att låta det finnas utrymme i ljudbilden för att höra när lägre volym finns i trafiken för att låta spelaren korsa vägen när det är säkert att göra så (Dae Shik Kim et al 2014).

Systemet för att hitta målpositioner liknade det som Loomis, Golledge och Klatzky (1998) byggde för att låta blinda navigera till olika platser. Deltagarna i deras studie uppskattade när positionen hördes i panoreringen av ljudet i ljudbilden.

För att främja navigeringen i spelet gjordes valet att slumpmässigt placera spelaren och de olika målpositioner i ett antal förutbestämda punkter, så att spelaren inte memorerade deras placering i 3D-miljön utan fokuserar på att använda sig av navigeringsmekaniken. Första målpositionen är alltid på samma plats, sedan slumpades de. Detta inspirerades av idéer från studien av Connors E.C et al (2014), samt att utmana spelaren genom dynamiska hinder som rörlig trafik.

Designen för ljuden i spelet var menade att kontrastera mellan miljöljud och navigationsljud. Miljöljuden innefattade ljud som stad-ambience, trafik, fåglar etc. Ljuden för navigationen var syntetiska och enkla. På så vis skapades en kontrast i ljudbilden för att enkelt kunna urskilja mellan vilka ljud som fyllde olika funktioner.

Navigationssystemet hade ett ljudsystem för lokalisering av målet, ljudet för det var ett kort frekvensrikt ljud som ändrade volym, tonhöjd och upprepningshastighet beroende på avstånd från spelaren. Dessa parametrar påverkades även av avståndet mellan spelaren och målet genom att påverka dem dynamiskt, samt baserat på ifall spelaren var vänd ifrån målet

(17)

eller ifall en byggnad var mellan målet och spelaren, då togs högfrekvent information bort från ljudet.

Det andra navigationssystemets funktion var att lokalisera och navigera runt väggar. Detta hade ett ljud som var ljust vars volym, tonhöjd och upprepning ökade ju närmare en vägg spelaren befann sig. Dessa hördes i vardera kanal (vänster och höger) oberoende av

varandra, samt en som spelades upp i mitten av stereobilden. Detta betyder att ifall spelaren endast hade en vägg till höger om sig hördes ljudet endast i höger öra. Var spelaren mellan två väggar hördes båda ljuden oberoende av varandra, vilket innebar att väggen som spelaren var närmast hördes tydligare än den andra.

Idéerna för navigationsljuden var grundade i valen av ljud som gjordes av Lokki och Gröhn (2005) i deras studie. Ljuden skapade till denna studie liknar ljuden i deras fjärde variant, som i sina ljud innehöll parametrar för volym, tonhöjd och upprepningshastighet.

Miljöljuden var ämnade att sätta spelaren i en virtuell stadsmiljö, detta gjordes genom att spela upp ljud som ofta hörs i stadsmiljöer såsom förbipasserande bilar, fåglar, allmänt “stads-brum” (trafik från avstånd och dylikt) etc. Fotstegsljud avgavs när spelaren rör sig, för att tydliggöra för spelaren att rörelse skedde.

Valet har gjorts att spelet inte endast är ett spel för personer med nedsatt syn, utan syftet är att utmaningen med spelet ska vara tillgängligt för både seende och blinda spelare. Då spelet inte återger någon visuell information alls (förutom vid menyval, detta påverkar dock inte spelprestation) finns ingen fördel hos spelare som är seende, vilket innebär att alla spelare ställs inför lika villkor för att överkomma spelets utmaningar. Spelet har designats för att uppmuntra att klara av spelet så fort som möjligt vilket kan ge en eventuell “tävlingsanda”till spelet samt mellan spelare, vilket i förlängningen kan bidra till att bygga en vänskaplig mötesplats för seende och blinda där de kan dela upplevelse i en gemensam aktivitet.

Detta spelet är designat efter frågeställningen till detta arbete, vilket är följande: Hur upplevs navigering i en virtuell 3D-miljö med endast ett ljudsystem som ger informativa ljud ämnade för navigering?

3.1 Metodbeskrivning

Spelet som byggts för studien var ämnat att användas som ett instrument för att låta deltagarna testa navigering i en virtuell 3D-miljö med endast ljud och mäta deras resultat. Detta skulle sedan ge en förståelse för hur ljud och dess design ger information som sedan avkodas av spelaren för att kunna navigera en 3D-miljö. I förlängningen ska det även kunna

(18)

ge ett spel som kan avnjutas av både spelare med nedsatt syn och seende spelare.

Förhoppningar finns om att detta ska möjliggöra en utökad marknad med inkluderande spel. Deltagarna tilläts först att vänjas vid spelets system via en övningsbana, och sedan när de klarat av den tilläts de att spela spelet. Deras mål var att navigera till de fem slumpmässigt utplacerade målpositionerna. Då studien ämnade att rikta in sig på huruvida ljudsystemet gav tillräcklig information var det viktigt att deltagarna hade förståelse för hur det fungerade innan de påbörjade testet.

Metodval för insamling samt bearbetning av data för detta arbete var följande: Insamling av data gjordes via ett deltagarformulär som skulle ge en bild av deltagarnas spelvanor,

spelsession under observation över nätet, följt av frågeformulär med kvalitativa frågor och slutligen skärmdumpar som visade deltagarnas rutt under spelsessionen. Frågorna som ställts var länkade till spelarens upplevelse av ljudsystemet samt hur användbart det var i relation till navigering.

Följande frågor ställdes till deltagaren: Deltagarformulär:

1. Deltagarnummer: 2. Ålder:

3. Hur många speltimmar per vecka? 4. Föredragen spelplattform?

5. Föredragen kontroll? 6. Föredragen spelgenre?

Formulär (efter speltest): 1. Deltagarnummer:

2. Hur användbart upplevdes ljudsystemen för navigationen? (1 - 5, där 1 är “oanvändbar“ och 5 är “mycket användbar”).

3. Hur svårt upplevdes navigationen i spelet? (1 - 5, där 1 är “inte svårt alls” och 5 “är mycket svårt”).

(19)

4. Hur svåra var ljudsystemen att lära sig? (1 - 5, där 1 är “inte svårt alls” och 5 “är mycket svårt”).

5. Förklara ditt tillvägagångssätt/strategi för att spela spelet. Fungerade det? 6. Vad hade förenklat navigationen för dig?

7. Varför?

8. Lade du märke till något särskilt i ljudbilden? Vad? 9. Hur upplevdes ambience och navigationsljuden? 10. Övriga tankar om spelet?

Deltagarformuläret gav en bild av vad för spelvanor deltagarna har och hur de själva

värderar dessa. Detta jämfördes sedan med deltagarens spelsession och genom jämförelsen skapades kopplingar mellan vilka vanor som kan ha varit bidragande till olika resultat. Formuläret efter speltest var menat att ge inblick i spelupplevelsen och eventuella svårigheter spelaren upplevt, samt frågor om tiden det tog innan spelaren vant sig till ljudsystemet. Williamson, Bow och Charles (2002) skriver att vid åsiktsfrågor kan man använda sig av Likertskalan, vilket har valts för de tre första frågorna i frågeformuläret. Speltestet sparade även skärmdumpar vid viktiga tillfällen med tidsstämpel, tillfällena var vid start, vid poäng, vid krock och vid avslut. Dessa bilder visade spelarens spelsekvens och den rutt som spelaren tog. Metod för analys av den insamlade datan gjordes via jämförelser av de olika deltagarnas spelsessioner och de ifyllda formulären. Datan som samlats in var kopplat till tid (total tid, genomsnittstid per mål och båda dessa vid det vinnande försöket), antal försök och jämförelser av spelavanor med föregående data och olika deltagare.

Williamson, Bow och Charles (2002) tar upp för- och nackdelar vid användning av

frågeformulär som datainsamlingsmetod. Då dessa är billiga att utföra, tillåter frågeformulär enkelheten att hitta en bredare urvalsgrupp, där urvalsgruppen inte behöver vara begränsad till en specifik geografisk plats. Dock avråder dem från att använda frågeformulär om djupare, ingående data behövs.

Trots det har valet gjorts att hämta in en del kvalitativ data från frågeformulär. Några av punkterna Williamson, Bow och Charles (2002) tar upp är bl.a: Svårigheter att få en tillräcklig svarsfrekvens, svårigheter att kontrollera hur och när formuläret besvaras, svårigheter att hämta komplex data där missuppfattning av frågor kan ske. Dessa har försökts att motverkas med att ha kontakt med deltagarna under hela undersökningen, och inte förrän alla formulär skickats in har kontakten avbrutits. Detta har bidragit till att

(20)

svarsfrekvensen är konsekvent, att formuläret fylls i direkt efter speltest (när upplevelsen fortfarande är ny) och vid behov så fick deltagarna förtydligande av frågor om något var otydligt.

Då frågeformuläret besvarades under observation fyller formuläret funktionen av

intervjufrågor, men med vissa av nackdelarna som formulär innefattar. Dock gjordes detta valet för att försäkra sig om att nätuppkoppling inte skulle påverka datan, samt att ha deltagarnas egna ord skrivna av dem själva, vilket förenklar analys. Frågeformuläret

försäkrar även att frågorna som ställs är konsekventa för alla deltagare och att uppfattningen inte påverkas av exempelvis en intervjuares tonläge mellan deltagare.

Valet har gjorts att blanda kvalitativa och kvantitativa frågor i undersökningen för att få data av båda typer. På så vis kan de olika datatyperna visa på likheter och olikheter hos de olika deltagarnas upplevelse samt prestationer.

Trots att man får en djupgående förståelse för situationen hos de individuella deltagarna så var möjligheten att dra tydliga slutsatser svårare då deltagargruppen var för liten. I sådana fall hade en kvantitativ studie varit bättre. Därav blandningen av de olika metoderna. Det kvalitativa har använts för att få förståelse för vilka designval i ljudsystemet som varit bidragande till spelets navigation och vilka som motverkade. Detta gav även möjlighet för deltagarna att uttrycka vad som hade kunnat ändrats för att förbättra deras spelupplevelse. Det kvantitativa (skärmdumpar, tid att klara spelet, åsiktsfrågor) har använts för att mäta deltagarnas prestation och jämföra dessa för att se skillnaden i spelsessionerna.

Denna studies frågeformulär var ämnade att ge information om hur ljudsystemet för navigationen upplevdes, ifall det fyllde den önskade funktionen, och vad som hade kunnat förbättras. Likertskalan används för att kunna ge en tydlig bild av hur funktionella

ljudsystemen är för spelaren och jämförs sedan med de andra deltagarnas svar.

Skärmdumpar av spelsessioner gav information om spelarens strategi för navigering av miljön, och kan även visa ifall deltagaren har visat förbättring under spelets gång. Dessa jämfördes sedan med andra deltagares spelsessioner för att jämföra ifall det fanns någon dominerande strategi. De slumpmässiga startpositionerna och målpositionerna kan försvåra användandet av tid det tog att klara spelet som ett pålitligt mått för att se hur effektivt ljudsystemen fungerar. Dock kan man se i stora drag ifall en deltagare tagit för lång tid eller inte att klarade av uppgiften.

Studiens syfte ämnar att bidra information i fältet för spelutvecklare för att kunna vidare utveckla spel som är inkluderande i sin natur för personer med nedsatt syn, istället för spel som endast är ämnade för dessa personer. Samt testa idéer baserade på föregående studiers

(21)

arbete för att forska vidare i information med ljud. För detta ger den kvalitativa metoden mer innefattande data för arbetet.

För att följa Vetenskapsrådets (2002) principer hämtades först och främst samtycke hos deltagarna som även informerades om villkoren för deltagandet samt deras rätt att avbryta deras medverkan när som helst utan några negativa konsekvenser. All personlig eller annan känslig data har anonymiserats innan det använts, och deltagarna gavs möjligheten att be om att all deras insamlade data skulle raderas.

(22)

4 Genomförande

4.1 Research / Förstudie

Det finns tidigare fall där spel har använt sig av ljud för lokalisering eller navigering i 3D-miljöer. Exempelvis First-Person-Shooters (FPS) som Counter Strike: Global Offensive (2012) eller Call of Duty: Warzone (2020) där spelaren behöver lyssna efter fiender i närheten med hjälp av ljud från fotsteg, skottlossning, fordon eller dylikt. Detta görs i samband med visuell återkoppling där i vissa fall visas det på spelarens karta vart ljudets position befann sig.

Ett annat exempel från Call of Duty: Warzone (2020) är intressepunkter i spelvärlden som lådor med utrustning eller uppdrag. Dessa avger ljud som är placerade i 3D-miljön, och ju närmare man tar sig till dem, desto intensivare blir ljudet tills man kommer fram till objektet. Ljudets position återspeglas även i stereobilden så att ljudet spelas från rätt kanal (höger eller vänster) beroende på objektets position i relation till spelarens position. Hellblade: Senua’s Sacrifice (2017) har ett moment där spelaren måste ta sig igenom en labyrint med hjälp av ljud från bl.a vind och vatten (samt haptisk återgivning om man spelar med en kontroll). Labyrinten är mörk och man kan endast se silhuetter av bl.a dörrar och fiender. Trots att det finns enkel visuell återkoppling (allt utanför avatarens direkta närhet är mörklagt och suddigt), ligger fokus på att spelaren ska använda sina andra sinnen för att navigera.

Hellblade använder sig av binaural teknik för att skapa en 3D-ljudmiljö som är trovärdig för att låta spelaren höra positioner och kunna lokalisera vart ljudkällor kommer ifrån, något som detta arbete försöker uppnå via dynamisk volym, tonhöjd och andra parametrar på ljudkällor som exempelvis bilen eller målpositionen.

Dessa idéer har hjälpt till med utformningen av detta arbetet, där fokus ligger på endast navigation med ljud utan visuell återkoppling.

4.2 Process

Arbetet utgick från idén att skapa ett spel fritt från det visuella, där ljud var i fokus för navigering i en 3D-miljö. Redan vid detta skede uppkom frågor relaterade till

grundfunktionerna i spelet. Exempelvis: Hur ska spelaren veta vart målet befinner sig? Hur ska spelaren navigera hinder i vägen för målet? Hur vet spelaren om de närmar sig målet?

(23)

Spelet har utvecklats i Unity (2005) och ljudsystemen implementerades via FMOD (2002). Arbetet påbörjades med att göra ett första utkast för spelet, som sedan utvecklades successivt efter behov och kritik från testning.

Ljuden som har gjorts för navigationsystemen: sensor- och målljudet, är ljud byggda utifrån syntetiska ljudfiler och effekter för att lätt kunna urskiljas från ljuden i spelet som speglar miljön. Ambience och biljud är gjorda från fältinspelningar som klipptes och gjordes till loopar digitalt i efterhand.

Målljudet började som ett kort syntetiskt ljud med snabb attack med ett kort delay med ca 8-10 upprepningar. Ljudet grundades från två sinustoner med intervallet av en musikalisk kvint som sedan gick igenom en effektkedja med aggressiv kompressor, resonanta filter, tremolo och ett granulärt eko. Detta ändras dynamiskt i spelet sedan genom volym och EQ beroende på avstånd, EQ när spelaren är roterad ifrån målet samt EQ och tremolo när en byggnad är i vägen för spelaren.

När spelaren befinner sig långt ifrån målet sänks basfrekvenserna samt att mid- och diskantfrekvenserna ökas, dessa frekvensändringar nollställs efter att spelaren är ca 100 meter ifrån målet. När spelaren närmar sig från 20 meter till 0 meter höjs mid- och

diskantfrekvenserna, upp till +5 dB och +10 dB respektive, samt att ljudets volym ökar upp till +3 dB starkare.

Filtret som ställts in när en byggnad är mellan spelaren och målet skär bort i de

basfrekvenserna med -1.5 dB, midfrekvenserna med -6 dB och förstärka diskantfrekvenserna med +2 dB.

Om spelaren är roteras ifrån målet tonas en tremolo-effekt in samt att basfrekvenser förstärks medans mid- och diskantfrekvenser skärs bort. Vid ca 90 grader börjar effekten tonas in och vid 180 grader ifrån målet ger maximal effekt

Figur 1 visar ljudets frekvensomfång och amplitud. I följande bilder visas en frekvensanalys på ett ljuds amplitud på Y-axeln och dess frekvensomfång på X-axeln.

(24)

Figur 1: Frekvensanalys av det första målljudet.

Detta ljud upplevdes för aggressivt och svårt att lyssna på under längre perioder vilket ledde till att en ny variant av målljudet utvecklades.

Nästa iteration av målljudet är baserat på två syntetiska ljud som har långsam attack, ett mörkt och ett ljust. Det ljusa är huvudljudet som spelas upp med liknande volym- och EQ-parametrar som det första ljudet. Det mörka/basiga ljudet automatiseras in dynamiskt när spelaren är nära ljudet för att ge feedback till spelaren för hur nära spelaren befinner sig målet. Detta ljudet upplevdes svårt att lokalisera och förvirrande, dels på grund av den långsamma attacken, men även på grund av dess mörka ton som visas i frekvensanalysen nedan (figur 2).

(25)

Figur 2: Frekvensanalys av det andra målljudet.

Det slutgiltiga målljudet (figur 3) gjordes med två ljud, ett kort pink noise klipp (ca 220 ms) och en kort ljudvåg (ca 300 ms) där en sinus och fyrkantsvåg har blandats. Detta spelar tonintervallet av en musikalisk kvint (C4 och G4). Ljudet är baserat på idéerna från Lokki och Gröhn (2005), figur 3 visar även frekvensrikheten av ljudet vilket är en viktig komponent av lokalisering enligt dem .

I FMOD har ljudet bearbetats med dynamiska parametrar för volym, tonhöjd, delay och EQ. Ju längre bort spelaren är från målet desto lägre tonhöjd och volym får ljudet och ton-klippet sänks i volym. I pink noise-klippet filtreras basfrekvenser bort ju längre spelaren är från målet. Upprepningen på delay-effekten blir snabbare ju närmare spelaren är målet (från 980 ms till 225ms per upprepning). Tonhöjden i ton-klippet höjs ju närmare spelaren kommer målet (upp till 15 halvtonsteg från max avstånd). Precis som med första målljudet så höjs diskant- och midfrekvenser samt att basfrekvenser skärs bort om spelaren är för långt ifrån målet, men nollställs igen om spelaren är närmare än 100 meter. Vid 20 meter eller närmare höjs diskantfrekvenser upp till +5 dB och midfrekvenser upp till +10 dB dynamiskt ju

(26)

Figur 3: Frekvensanalys av det slutgiltiga målljudet.

(27)

Finns en byggnad i vägen (figur 4) används liknande system som med de tidigare ljuden. Dock med vissa ändringar, i detta sänks midfrekvenser med -33 dB och diskantfrekvenser med -29 dB samt att basfrekvenser förstärks med +4 dB. Figur 4 visar hur detta påverkar ljudet.

Filtret som används när spelaren är vänd från målet (figur 5) har ändrats för att bättre anpassa det nya ljudet. Detta aktiveras fortfarande vid ca 90 graders rotation från målet och parametrarna ändras gradvis till sitt maximala värde vid 180 grader vänt från målet. Ett lågpassfilter aktiveras och går ner mot 900 hz. Diskant sänks ännu mer med en EQ

parameter som sänker med -5 dB. Samma EQ sänker midfrekvenser med -16dB och slutligen höjer basfrekvenserna med +6 dB. Sedan appliceras en tremolo effekt med 8 hz frekvens och djupet på kurvan går upp till 100% när spelaren är vänd 180 grader från målet. Ett reverb appliceras också med en längd på 1.5 sekunder, där även wet-volymen höjs beroende på spelarens rotation, och dry-volymen sänks med -4 dB på liknande sätt.

Figur 5: Frekvensanalys av det slutgiltiga målljudet med filter för när spelaren är vänd ifrån målet. Figurer 3, 4 och 5 visar hur de olika filtren påverkar målljudet beroende på position och rotation av spelaren i relation till målpositionen, samt ifall byggnad är i vägen eller ifall det är fri sikt till målet. Ljudet har vissa förstärkta frekvenser vid 600 - 1 000 hz som skiner igenom vid varje filter vilket hjälper att alltid kunna höra, samt att dessa frekvensanalyser visar att ljudet är frekvensrikt även vid alla filter och att de olika filtren påverkar ljudet olika.

(28)

Det första sensorljudet var en enkel sinuston som ökade i volym beroende på avstånd till närmaste vägg. Den hade även ett tremolo som ökade tempo i samband med avståndet. Detta upplevdes som svårt att lyssna på under längre perioder, vilket ledde till att ett nytt sensorljud utvecklades. I frekvensanalysen (figur 6) visas det att ljudet har snäv

frekvensbredd (hög amplitud vid 600 hz).

Figur 6: Frekvensanalys av det första sensorljudet.

Det andra sensorljudet är uppdelat i tre olika ljud. Först när spelaren närmar sig en vägg spelas en sömlös loop av ett ackord spelat från ett elpiano, sedan när spelaren kommer en bit närmare väggen spelas en sinuston upp med tremolo, vars hastighet och ljudets tonhöjd ökas ju närmare väggen spelaren kommer. Sista ljudklippet är en ljus sinuston som är statisk och den spelas upp när spelaren nått fram till väggen och inte kan fortsätta längre. Figur 7 visar en frekvensanalys av ljudet, där frekvensomfånget är ungefärligt mellan 300 - 1700 hz.

(29)

Figur 7: Frekvensanalys av det slutgiltiga sensorljudet.

I det första utkastet gjordes funktionerna för spelaren (rörelse och sensorer), målpositioner och sedan en bana som utvecklades över tid. När dessa funktioner gjorts utvecklades sedan ljudsystemet i FMOD för funktionerna och sedan implementerades i spelmotorn.

I det första utkastet var det totala antalet sensorer 8, som var jämnt utspridda från spelaren med 45 grader mellan varje (figur 8).

Ljudeffekten för sensorerna var en ton som spelas upp när en sensor aktiverats, ljudet var även utspritt i stereobilden motsvarande den sensor som aktiverats t.ex höger sensor aktiveras, då spelas sensorljudet för högerkanal. Ju närmare spelaren kom hindret desto starkare blev ljudet, samt att det började pulsera i ökande hastighet beroende på avstånd. Det spelades även olika tonhöjder beroende på riktning, detta var ämnat att kunna hjälpa urskilja vilken sensor som aktiverats. Tonhöjden för sensorerna hängde ihop enligt färgerna i bilden nedan.

(30)

Figur 8: Visualisering av den första versionen av sensorer.

Under en tidig testning visade sig detta system bidra till problem med att navigera då panoreringen för de diagonala sensorerna spelades upp i båda kanalerna även om den ena kanalen var starkare än den andra, vilket ledde till problem med att förstå var hindren var placerade. Ett annat problem som uppkom var att vid trånga utrymmen med två hinder på vardera sida aktiverades flera sensorer vilket gjorde det otydligt för spelaren att veta vilken riktning de skulle gå. Slutligen upplevdes ljuden för aggressiva vilket gjorde dem svåra att använda under längre stunder, vilket var problematiskt då de är en viktig beståndsdel av spelupplägget.

Detta åtgärdades genom att byta antal sensorer från åtta till fyra (figur 9) och ändra ljudet till ett mjukare ljud som följer idéer från studien gjord av Lokki och Gröhn (2005) genom att ändra tonhöjd, upprepningshastighet och volym beroende på avstånd till hindret. Vid denna variant spelas en tonhöjd för vänster och höger, en annan tonhöjd för fram och slutligen en sista för bak. Spelbanan modifierades även för att undvika byggnader som var placerade för nära varandra.

(31)

Slutligen visade det sig att den bakre sensorn var överflödig då spelaren inte behövde använda sig utav den, utan navigeringen funkade med endast vänster, höger och främre sensorer enligt figur 10.

Figur 10: Visualisering av den slutgiltiga versionen av sensorerna.

Målljudet genomgick ändringar då första versionen ljudet ansågs vara för aggressivt vilket gjorde det svårt för användaren att lyssna på under längre perioder. Det ändrades till långsamt “vågliknande”-ljud som ökade i volym och förstärkte basfrekvenserna ju närmare man kom målet. Detta gjorde det dock svårare att hitta målet samt att föregående studier (exempelvis Lokki och Gröhn (2005) och Gidla (2017)) uttryckte att korta skarpa ljud var mer användbara vid lokalisering. Därför gjordes en sista ändring till det nuvarande målljudet där ett kort och skarpt ljudklipp ökar i upprepningshastighet, tonhöjd och volym ju närmare målet spelaren befinner sig. Målljudet spelas även bara upp när spelaren befinner sig i ett stillastående tillstånd, detta har valts dels för att hjälpa spelaren fokusera på rätt ljud när spelaren rör sig och står still, och dels för att ge en utmaning i spelet genom att spelaren är tvungen att vänta för att lista ut vart de ska navigera.

Filtret som aktiveras vid stillastående tillstånd “fokuserar” ljudbilden på de viktiga ljuden: Målljudet och billjudet. Ambience filtreras och reverbereras kraftigt och sensorerna filtreras och sänks i volym. Dessa hörs fortfarande men svagt, för att ge plats i ljudbilden för spelaren att höra det som är relevant. Så fort spelaren rör sig igen återställs ljudbilden.

För att förenkla designen av spelbanan modellerades en spelbana i Unity med hjälp av enkla geometriska former för att efterlikna konturen av en stadsmiljö. Detta döljs sedan för

spelaren under spelsessionen, vilket gör detta endast till ett verktyg för att hjälpa till med visualisering av spelmiljön och den önskade designen av den. Tack vare detta var det enkelt att testa idéer och vid behov göra ändringar utan att förvirras av den osynliga miljön.

(32)

Figur 11: Överblicksbild på första layouten för spelbanan, samt de olika målpositionerna. Layouten på spelbanan gjordes med målet att efterlikna en stadsmiljö med olika byggnader med olika storlek och form. Målpositionerna slumpas sedan ut en i taget på ett antal

förutbestämda platser, som spelaren sedan behöver hitta. I samband med det första

sensorljudet var det svårt att navigera vid trängre platser som exempelvis vid position 6 och 7 i figur 11. Detta ledde till att spelbanan gjordes om med färre byggnader vilket tillät fler öppna ytor (speciellt vid den nedre delen av spelbanan).

(33)

Figur 12: Slutgiltiga designen för spelbanan, där de vita fyrkanterna är målpositionerna, den svarta är alltid första målpositionen och de blå fyrkanterna är spelarens startpositioner.

I den slutigiltiga designen för spelbanan finns det en förbestämd första position för målet och fyra slumpade startpositioner för spelaren som visas i figur 12. Detta gjordes för att undvika att spelaren skulle börja för nära en annan målposition och kunna nå den av slump utan att behöva navigera (som vid målposition 9 och startposition 4 eller målposition 6 och startposition 3).

4.3 Förstudie

Inför undersökningen gjordes en förstudie på en grupp av tre olika deltagare för att pröva funktionaliteten av studien. Deltagarna fick en beskrivning av spelet och ljuden samt dess funktioner i spelet. Efter det fick deltagarna testa funktionerna i en övningsbana som var utformad för att lära ut navigering och lokalisering av målpositioner. När deltagarna uppnådde alla målpositioner påbörjades spelundersökningen.

Under denna skulle deltagaren hitta fem slumpmässigt utsatta målpositioner samt undvika bilen som körde runt på spelbanan. Vid krock med bilen började spelaren om från början. Vid start och varje följande poäng togs en skärmdump från en kamera i spelet (ej synligt för spelaren).

(34)

När speltestet var klart fyllde deltagarna i ett formulär med frågor angående spelet och sedan skickade deltagarna de skärmdumpar som tagits under spelsessionens gång. Dessa visar spelarens startposition, rutt samt målpositionerna.

Figur 13: Bild på skärmdump från en spelsession. Röd ikon är spelarens position, blå ikon är startposition, svarta ikoner är uppnådda målpositioner och lila linje är spelarens rutt.

Figur 14: Följande skärmdump av samma spelsession som figur 13.

Nedan följer en tabell med resultaten från deltagarna i pilotstudien som visar hur många försök varje deltagare behövde för att klara uppgiften, hur lång tid mellan varje mål som användes samt totala tiden att klara av uppgiften.

Tabell 1: Resultaten från deltagarna i pilotstudien

Deltagare:

Antal

försök: 1 Mål 1 Mål 2 Mål 3 Mål 4 Mål 5 Total tid: 1 Försök 1: 46 sek 48 sek 48 sek 1 min 41 51 sek 4 min 54

(35)

sek sek

Deltagare:

Antal

försök: 4 Mål 1 Mål 2 Mål 3 Mål 4 Mål 5

2 Försök 1: 1 min 7 sek N/A N/A N/A N/A

Försök 2: 34 sek 40 sek 51 sek

1 min 18

sek N/A

Försök 3: 36 sek 31 sek 59 sek N/A N/A

Försök 4: 22 sek 41 sek

2 min 23

sek 55 sek 54 sek

15 min 46 sek

Deltagare:

Antal

försök: 4 Mål 1 Mål 2 Mål 3 Mål 4 Mål 5

3 Försök 1: 38 sek 28 sek 43 sek N/A N/A

Försök 2: 37 sek 53 sek

1 min 43

sek N/A N/A

Försök 3: 32 sek 41 sek N/A N/A N/A

Försök 4: 21 sek 1 min 16 sek 2 min 46 sek 0 sek (bugg) 1 min 15 sek 15 min 30 sek

Vid analys av resultaten från skärmdumparna, tiden mellan målen samt formulären fyllda av deltagarna visades ett antal likheter. Två av deltagarna skrev i sina formulär om liknande strategier de hade för att hitta målen, en deltagare skriver: “Rikta sig mot målet samt röra sig "statiskt" (inte vrida på spelarens vy för mycket)” och den andra “Först stod jag still för att sikta mot målet.” Den tredje deltagaren beskriver en strategi för undvika bilen “jag började hålla mig till byggnader för att undvika bilen [...] sedan så kramade jag väggarna en del tills ljudet slutade så jag visste att jag kommit runt byggnaden”.

Vid frågan “Hur svåra var ljudsystemen att lära sig?” där 1 = inte svårt alls och 5 = mycket svårt svarade alla tre deltagare med 2. I och med detta kan slutsatsen dras att deltagarna upplevde att inlärningen av funktionen för ljudsystemen inte var svåra att lära sig. Dock speglar det inte hur svårt det var att faktiskt navigera i spelet. Enligt svaren på frågan “Hur svårt upplevdes navigationen i spelet?” där 1 = inte svårt alls och 5 = mycket svårt svarade deltagarna utspritt från med 2, 3 och 4.

(36)

Deltagarna kom med unika förslag till vad som hade kunnat förenkla navigationen för dem. Förslagen som togs upp var: Öka hastigheten som målljudet hörs från när spelaren blir stillastående, detta för att “snabbare kunna lokalisera målet igen efter att man rört sig”. Lättare att höra bilens position, för att spelaren hade svårt att veta vilket håll de skulle röra sig för att undvika bilen. Annorlunda ljud eller ljudstyrka för sensorerna, då det upplevdes ta över ljudbilden men “svårt att säga om det var till min fördel eller nackdel”.

När de frågades ifall något speciellt lades märke till i ljudbilden gavs det kritik på ljudbilden. Bland annat uppskattades tonhöjdsförändring vid sensorerna och att panoreringen

upplevdes enkel att följa. Det riktades även kritik mot målljudet där en deltagare ansåg att: “Måljudet hade aningen skarp attack”.

I frågan “Hur upplevdes ambience och navigationsljuden?” svarade deltagarna positivt.

“Mycket bra, var förvånansvärt tydligt” och “klara och lätta att höra, ambience tog inte över ljudbilden”.

(37)

Figur 16: Skärmdump från avslutet av andra deltagarens spelsession.

Figur 17: Skärmdump från avslutet av tredje deltagarens spelsession.

Vid analys av skärmdumparna kan man se områden där deltagarna hade svårare att navigera, exempelvis den södra delen av banan eller den nordöstra delen. Detta kan vara kopplat till tätheten mellan byggnader och även spelbanans ände.

(38)

Ett antal ändringar har gjorts för att åtgärda problemen som uppkom under förstudien. Bland annat en bugg där efter spelaren började om efter en krock alltid började från samma plats. Bilens ljudsystem har även ändrats för att enklare höra ifall den är framför eller bakom spelaren. Ett deltagarformulär har även gjorts för att få en bättre bild av deltagarnas tidigare erfarenheter med spel. I skärmdumpssystemet har det även lagts till skärmdump vid

(39)

5 Utvärdering

5.1 Presentation av undersökning

Undersökningen som genomfördes gjordes över nätet, där deltagarna blev kontaktade över nätet vid en förutbestämd tidpunkt för varje individuell deltagare. Innan deltagarna värvades försäkrades det att de hade en dator, hörlurar och uppkoppling till nätet. Kontakten gjordes via Discord (2015) där deltagarna blev uppringda. Deltagarna fick förklarat verbalt vad för rättigheter de har som deltagare av studien, vilket innebar deras rätt avbryta testet när som helst, anonymisering av all data samt att vid önskan så raderas all insamlad data. Efter det gavs en kort översikt av vad undersökningen gick ut på, vilken frågeställning arbetet utgått ifrån och vad deltagaren skulle göra (formulär, speltest och skicka bilder).

Först efter detta fick deltagaren fylla i deltagarformuläret (Appendix A), sedan gavs

deltagaren nedladdningslänk till spelet. I spelmappen fanns en textfil (Appendix C) som gick igenom spelets mål och funktioner, instruktioner för att kontrollera spelaren och hur man navigerar menyerna i spelet. I denna text gavs även en beskrivning av de olika ljuden som hördes i spelet och deras funktion. Deltagaren fick vid behov tillgång till denna text under speltestet samt verbal hjälp vid vissa tillfällen.

När deltagaren läst igenom texten fick de spela igenom övningsbanan, när den var avklarad gick deltagarna vidare till speltestet. Under speltestet fick deltagarna spela tills de klarade av att få fem poäng, vid förlust (krock med bil) återställdes poängen tillbaka till noll och

spelaren fick börja om. När speltestet avslutats skickade deltagaren de skärmdumpar som lagts till i spelmappen.

Slutligen fick deltagaren svara på ett frågeformulär (Appendix B), med frågor om spelupplevelsen och upplevelsen av ljudens funktion.

5.2 Analys

Undersökningen bestod tolv deltagare, varav alla uppfyllde sitt deltagande i undersökningen. Åldersgruppen av deltagarna varierade mellan 23 - 30 (figur 18), där större delen av

deltagarna var 24 år gamla. Skillnaden i ålder är någorlunda smal vilket gör det svårt att se ifall resultat beror på vilken åldersgrupp deltagarna befinner sig i. Dock kan man se vilka resultat som skiljer sig och vilka som är lika trots närliggande åldersgrupp.

(40)

Figur 18: Stapeldiagram av deltagarnas ålder.

Figur 19: Cirkeldiagram av antal speltimmar per vecka.

Speltimmar per vecka (figur 19) vairerade mellan deltagarna, men störst andel svarade 5 - 9 timmar/vecka, 10 - 14 timmar/vecka och 20 - 25 timmar/vecka som har vardera tre

(41)

Figur 20: Cirkeldiagram av deltagarnas föredragna spelplatform.

Figur 21: Cirkeldiagram av deltagarnas föredragna kontrolltyp.

Figur 20 visar att elva deltagare hade PC som föredragen spelplattform, en hade Nintendo Switch. Figur 21 visar att elva deltagare föredrog tangentbord och mus som kontrolltyp, en föredrog handhållen kontroll.

(42)

Figur 22: Cirkeldiagram av deltagarnas föredragna spelgenre.

Deltagarnas föredragna spelgenre var jämnt utdelad på olika spelgenres. I det här fallet har olika svar tolkats och organiserats för att sammanställa till cirkeldiagrammet. En deltagare som svarade: “äventyr med bra story” tolkades som Action/äventyr. En annan deltagare som svarade: “rpg/sandbox” tolkades som RPG. Figur 22 visar sammanställningen i ett cirkeldiagram.

References

Related documents

Yttrande över Naturvårdsverkets skrivelser "Förslag till författningsändringar med allmänna regler för vissa verksamheter som behandlar avfall" och "Förslag till

[r]

Varje boksida utgör en grupp av uppgifter, representerande ett visst avsnitt i kursplanen, så att varje sida räcker för t v å veckor, omkring 12 exempel.. Dessa barn önskar

Liksom vid andra offerkällor i södra Sverige torde den hed- niska kultfesten vid Rosenkinds källa varit förlagd till tiden för som- marsolståndet.. Genom att helga det invid

Hjiilpmedel: Beta,

Göra en processinriktad presentation av dokumentplanen/arkivförteckningen.. Dokumentplanering

Eftersom vissa av kraven är kvalitativa Knapp till växelväljare - Kund vs.

"att bifalla motionens första att-sats under förutsättningar att inrättande av "Röda telefonen" i Blekinge sker inom ra1nen för beslutad budget", "att avslå