• No results found

Binaural ljudlokalisering i olika våningsplan i vertikala miljöer: En undersökning om binaural ljudlokalisering i FPS-spel

N/A
N/A
Protected

Academic year: 2022

Share "Binaural ljudlokalisering i olika våningsplan i vertikala miljöer: En undersökning om binaural ljudlokalisering i FPS-spel"

Copied!
49
0
0

Loading.... (view fulltext now)

Full text

(1)

BINAURAL LJUDLOKALISERING I OLIKA VÅNINGSPLAN I

VERTIKALA MILJÖER

En undersökning om binaural ljudlokalisering i FPS-spel.

BINAURAL SOUND LOCALIZATION IN DIFFERENT FLOORS IN

VERTICAL ENVIORMENTS

A study about binaural sound localization in FPS-games.

Examensarbete inom huvudområdet Medier, estetik och berättande

Grundnivå 30 högskolepoäng Vårtermin 2020

Herman Gustafson Mario Cancar

Handledare: Anders Sjölin Examinator: Jamie Fawcus

(2)

Sammanfattning

Detta arbete syftar till att undersöka hur binauralt ljud upplevs i avseende till spelares förmåga att lokalisera ljudkällor i olika våningsplan i digitala spel i jämförelse med stereoljud. Arbetet kopplas till tidigare forskning inom ljudteknik i digitala spel. För att undersöka frågeställningen har en artefakt skapats i form av en digital miljö där målet är att lokalisera ljudkällor i olika våningsplan. Artefakten är skapad i två versioner, där den ena versionen använder binauralt ljud och den andra använder stereoljud. Arbetet har använt kvantitativa och kvalitativa metoder. Resultatet av dessa analyseras och jämförs för att utröna vilken teknik som lämpas bäst för ljudlokalisering i digitala spel.

Nyckelord: Binaural, stereo, ljudlokalisering, upplevelser, spel

(3)

Innehållsförteckning

1 Introduktion ... 1

2 Bakgrund ... 2

Örat och ljudet ... 3

Lokalisering av ljud ... 4

Binaurala inspelningar ... 4

HRTF ... 5

Binaural mjukvara ... 5

Binauralt ljud i digitala miljöer ... 6

3 Problemformulering ... 8

Metodbeskrivning ... 9

3.1.1 Artefakt ... 9

3.1.2 Datainsamling ... 11

Diskussion ... 12

4 Genomförande ... 14

Research ... 14

Etik ... 14

Progression ... 15

4.3.1 Mjukvara ... 15

4.3.2 Spelmiljö ... 15

4.3.3 Steam Audio ... 16

4.3.4 Parametrar och inställningar ... 17

4.3.5 Scripts ... 17

4.3.6 Ljud ... 17

4.3.7 Designval ... 18

Pilotstudie ... 19

5 Utvärdering ... 21

Presentation av undersökning ... 21

5.1.1 Uträkning av resultat ... 21

Kvantitativt resultat ... 22

5.2.1 Sammanställt resultat av binaural version ... 22

5.2.2 Individuella resultat av våningarna i binaural version ... 23

5.2.3 Sammanställt resultat av stereoversionen ... 25

5.2.4 Individuella resultat av våningarna i stereoversion ... 26

5.2.5 Binaural vs Stereo ... 28

Kvalitativt resultat ... 29

Analys ... 29

Slutsatser ... 30

6 Avslutande diskussion ... 31

Sammanfattning ... 31

Diskussion ... 31

Framtida arbete ... 33

(4)

Referenser ... 34

(5)

1

1 Introduktion

Den här undersökningen studerar binauralt ljud och spelares förmåga att lokalisera

ljudkällor i digitala miljöer. Binauralt ljud innebär att man försöker simulera ljud på samma sätt som våra öron uppfattar ljud. Detta innefattar att flera olika viktiga faktorer bearbetas för att skapa en så verklighetstrogen lyssningsupplevelse som möjligt. Exempelvis beräknas tidsskillnader när ljud når öronen, samt volymskillnaden mellan dessa olika upptagningar.

Termen binauralt ljud är ett relativt brett begrepp som används i flera olika sammanhang.

Man kan exempelvis skapa binaurala inspelningar genom att använda en eller flera

mikrofoner. Binauralt ljud finns även i form av mjukvara som syftar till att rendera realistiskt spatialt ljud i virtuella miljöer. En annan term som är återkommande inom detta ämne är HRTF (Head-related-transfer-function), som beskriver hur människans kropp påverkar ljudets filtrering innan det når öronen.

Arbetet har inspirerats utifrån egna erfarenheter och upplevelser av auditiva tekniska begränsningar i moderna digitala spel. I synnerhet är det problem gällande lokalisering av ljudkällor i höjdled som uppmärksammats i vissa förstapersonsskjutare. Denna

undersökning syftar till att undersöka auditiv teknik i form av binauralt ljud, och hur denna teknik upplevs i avseende att lokalisera ljud i höjdled i virtuella miljöer.

Detta arbete inleds med en redogörelse för människans förmåga att lokalisera ljud med hjälp av binaural hörsel. Detta kopplas senare till binaural mjukvara och hur detta kan simuleras i digitala miljöer.

För detta arbete har en kvalitativ metod använts i form av ett speltest och en uppföljande intervju.

(6)

2

2 Bakgrund

Binauralt ljud är i stora drag en teknik som syftar till att återskapa 3D-ljud. Detta beror på att inspelningstekniken baseras på att återge ljuden på samma sätt som örat upplever ljud i vekligheten. Genom att använda två mikrofoner strävar tekniken efter att återskapa en verkligenhetstrogen upplevelse av ljudet.

Binaural inspelningsteknik har på senare tid uppmärksammats i samband med ett nytt populärt fenomen; Autonomous Sensory Meridian Response (ASMR). Men har i själva verket existerat sedan 1881 då en uppfinnare vid namn Clement Ader gjorde den första binaurala inspelningen (Farkas, T. 2018).

En annan faktor till att binauralt ljud fått mer uppmärksamhet är dess användning i VR-spel (Hacihabiboglu, H., De Sena, E., Cvetkovic, Z., Johnston, J. & Smith, J. 2017).

HRTF (Head-related transfer funtion) är hur ljud filtreras baserat på bröstkorg-, huvud- och öronmusslans-form. Det finns även mjukvara som syftar till att återskapa binauralt ljud. Ett exempel på ett spel som använder detta är Counter Strike Global Offensive

(2012). Binauralt ljud i datorspel utgår från att återskapa en verklighetstrogen simulation av hur ljud rör sig i en miljö samt hur detta uppfattas av lyssnaren.

Ljud i datorspel är ett viktigt verktyg för spelare att införskaffa information. Detta är särskilt tydligt i FPS-spel där spelaren kan dra stor nytta av att lyssna efter fiendens fotsteg och på så sätt anpassa sin positionering eller riktmedel för att nedkämpa denne.

Trots att dagens spel har nått en hög teknologisk standard finns det ändå auditiva begränsningar. Egna observationer visar att återkommande problem i många spel är urskiljandet av ljudkällor i höjdled vilket kan skapa stor förvirring hos spelare.

(7)

3

Örat och ljudet

Enligt Kapralos, B., Millios, E. & Jenkin, M. (2008) fungerar ljud på detta sätt: vibrationer eller rörelser från objekt orsakar variationer i lufttrycket. Dessa variationer uppfattas av vårt hörselsystem som i sin tur tillåter oss att uppfatta ljudet.

Hörselns huvudsakliga användningsområden är att lokalisera och identifiera rymd, yta och objekt samt fungera som en reaktionsmekanism (Hulusic, V., Harvey, C., Debattista, K., Tsingos, N., Walker, S., Howard, D. and Chalmers, A. 2012).

Enligt Lakka, E., Malamos, A., Pavlakis, K.G. & Ware, J. A. (2018) färdas ljud genom luften och påverkas av omgivningen på olika sätt. Ljudvågen kan exempelvis stöta på ett objekt eller en gränslinje för ett rum vilket bryter ljudvågens riktning och påbörjar en annan färdriktning. Beroende på ljudvågens storlek och det reflekterande objektets dimensioner kan ljudvågen antigen reflekteras och studsa, eller splittras och studsa åt flera olika håll. När ljudvågen bryts kan tre olika fenomen uppstå: Reflektion, diffraktion och refraktion, se (figur 1).

Den delen som studsar tillbaka till ljudkällan kallas för reflektion. Diffraktion uppstår exempelvis när en ljudkälla är skymd i förhållande till lyssnarens position och ljudvågorna klämmer sig mellan öppningar, vinklar och objekt för att nå lyssnaren. Refraktion är förändringen hos diffraktionen, dvs ljudvågornas riktning. Detta sker då ljudvågor ändrar färdriktning då de passerar mellan två medium, t.ex. när ljudet går från en tätare till en tunnare substans (McGregor, I. 2014).

Ljud kan även beskrivas på en mängd olika sätt exempelvis: Styrka, ton, klangfärg och varaktighet (McGregor, I. 2014). Återkommande termer är spatial, dynamik, temporär, spektral, material och interaktion. Spatiala attribut refererar till ljudets förhållande till utrymme, exempelvis avstånd, orientering och eko. Dynamiska attribut relaterar till

Figur 1: Bilden visar tre fenomen som kan uppstår

(8)

4

variationer i ljudet, exempelvis volym, intensitet och skala. Temporära ljud syftar på ljudets förhållande till tid, exempelvis längd och rytm. Spektrala attribut syftar på repetitioner av ljud i förhållande till klangfärg och frekvens (McGregor, I. 2014).

Lokalisering av ljud

Förmågan att lokalisera ljudkällor i ett akustiskt utrymme med hjälp av två öron kallas för spatial eller binaural lokalisering (Farkas, T. 2018).

Förmågan att lokalisera ljud påverkas huvudsakligen utifrån två olika

faktorer; Interaural Time Difference (ITD), som utgör tidsskillnaden mellan öronen när vi hör ett ljud, samt Interaural Level Difference (ILD), som utgör volymskillnaden mellan öronen, se (figur 2). Möjligheten att kunna lokalisera ljud som kommer framifrån eller bakifrån förlitar sig på öronmusslans förmåga att filtrera ljud (Hulusic et al. 2012).

Utöver detta påverkas vår förmåga att lokalisera ljud utifrån vilka egenskaper ljudet har.

Enligt Doerr, KU., Rademacher, H., Huesgen, S & Kubbat, W. (2007) är ljud med bred frekvensomfattning över 5kHz underlättande för lokalisering av ljudkällor.

Binaurala inspelningar

Binaurala inspelningar syftar till att återge spatialt ljud på samma sätt som det mänskliga örat uppfattar ljud. För att göra binaurala inspelningar placeras två mikrofoner på varsin sida om ett objekt som har samma dimensioner som ett mänskligt huvud, dessa kallas för

Figur 2: Bilden visar skillnaden på ankomsttid, dB-nivå och frekvensinnehåll för varje öra.

(9)

5

dummy-heads. Eftersom mikrofonerna är positionerade på det här sättet upptas ljudet på samma sätt gällande frekvens och fördröjning mellan de två mikrofonerna som det

mänskliga örat skulle göra.

Dock blir användandet av binaurala inspelningar begränsat då dessa inspelningar är statiska i förhållande till ljudkällan och lyssnaren. Datorspel är oftast icke-linjära och dynamiska.

Därför måste ljudet kunna filtreras beroende på exempelvis avstånd, reflektioner och spelarens position i den virtuella miljön.

HRTF

Ytterlige en faktor som påverkar vår förmåga att lokalisera ljud är något som kallas för Head- related transfer function (HRTF). Detta är en funktion som beskriver hur ljud filteraras i förhållande till formen på individers överkropp, dvs huvud, axlar och öronmussla. Genom att använda HRTF i mjukvara kan man med komplexa algoritmer filtrera ljudet och på så sätt skapa ett realistiskt 3D-ljud (Lokki, T., Savioja, L., Vaananen, R., Huopaniemi, J. and Takala, T.

2002).

Binaural mjukvara

Binaural mjukvara syftar till att simulera 3D-ljud i digitala miljöer.

För att simulera binaural- eller spatial återgivning i datorspel finns flera olika metoder och mjukvaror tillgängliga. Exempelvis används ray-tracing för att analysera den digitala miljön och på så sätt räkna ut hur ljudet ska manipuleras och filtreras (Cheng, Wakefield, 1999).

För att skapa realistiskt spatialt ljud och göra uträkningar på hur det ska filtreras i en digital miljö krävs en modellering av Room Impulse Reponse (RIR). RIR är ett sätt att analysera ett rum för att beräkna hur ljudet skall filtreras. Det finns två huvudsakliga metoder för att beräkna detta: Geometrisk strålbaserad akustisk modellering (Ray-casting/tracing) och vågbaserad modellering (Wave-based).

Ray-casting, eller ray-traced acoustical room responses utgår i huvudsak från signaler som skickas ut i form av strålar genom den virtuella miljön. Strålarna interagerar med objekt och använder matematiska modeller för att beräkna hur ljudet ska förändras.

Vågbaserade metoder försöker återskapa ljudvågor genom komplexa algoritmer. Målet är

(10)

6

att numeriskt lösa vågekvationen för de ytorna som finns i den modellerade världen (Kapralos, B et al. 2008).

Binauralt ljud i digitala miljöer

På senare tid har det skett en utveckling inom binauralt ljud. Detta är mycket tack vare virtuella spel som syftar till att skapa en så realistisk upplevelse som möjligt för spelaren.

Utvecklingen av virtual-reality (VR) har i sin tur lett till att man börjat utforska auditiva möjligheter för att förhöja spelares inlevelse vilket resulterat i att utvecklingen av ljudteknik i digitala spel ökat (Farkas, T. 2018).

Vikten av ljud i spel varierar ofta beroende på vilken genre spelet tillhör. I vissa typer av spel fungerar ljudet som en central mekanik i spelet, snarare än en stämningsförstärkande aspekt. I spel som exempelvis Counter Strike Global Offensive (2012) och PlayerUnknown´s Battlegrounds (2017) är införskaffandet av information via ljud till stor fördel för spelaren.

Genom att lyssna efter exempelvis skott och fotsteg kan spelaren på så sätt införskaffa sig information om sin omgivning som i sin tur ökar dennes chanser att lyckas (Farkas, T. 2018).

Tidigare forskning visar att binauralt ljud upplevs positivt av spelare inom FPS-genren. I en undersökning av Brieger, S & Göthner, F (2011) undersöktes spelares upplevelser av HRTF i jämförelse med stereo i ett FPS-spel. Respondenterna fick utföra olika tester med fem olika metoder för återgivning av HRTF. Varje respondent fick lyssna efter ett repeterande ljud som förflyttades i den digitala miljön och därefter återge sina upplevelser. Den metod som gav bäst resultat valdes för genomförande av nästa test. I detta test fick respondenterna spela Unreal Tournament 3 (2007) och använda den utvalda HRTF-metoden för

ljudåtergivning. Därefter ersattes ljudåtergivningen med stereoljud för att låta

respondenterna jämföra sina upplevelser av de två teknikerna. Undersökningen visade att majoriteten av respondenterna ansåg att HRTF ökade deras förmåga att lokalisera ljudkällor, i synnerhet gällande höjdled och djupled samt att denna teknik skulle förbättra deras

prestationer i andra FPS-spel.

(11)

7

Användandet av binaurala inspelningar i datorspel blir till en viss grad begränsade eftersom dessa inspelningar är linjära, medan datorspel är icke-linjära, Dvs att ljudbilden i datorspel förändras efter till spelarens val.

Genom att implementera en sådan mjukvara i datorspel avgör HRTF hur ljudet i den digitala miljön ska filtreras utifrån spelarens position och riktning. För att göra detta adderas en HRTF komponent på listener-objektet i spelmiljön. Listener-objektet adderas i sin tur på avatarens huvud för att simulera virtuella öron (Sanjay, M. 2013). Genom att använda HRTF sker all filtrering av ljud i realtid i förhållande till spelarens position (Fay, T.M., Selfon, S.

& Fay, T.J. (2004). I kombination med spelares förmåga att vända sig mot ljudkällan möjliggör detta att spelare kan avgöra var ljudet kommer ifrån.

(12)

8

3 Problemformulering

Detta examensarbete har baserats på de auditiva problem som kan uppstå i digitala spel till följd av begränsningar i deras ljudmotor. I synnerhet är det problem gällande lokalisering av ljudkällor i höjdled som inspirerat till arbetet. Dessa problem är särskilt tydliga inom vissa genrer för digitala spel, där användandet av ljud kan vara mycket hjälpsamt för spelaren.

Genom att lyssna efter exempelvis fotsteg eller skott kan spelaren skapa sig en uppfattning om sin omgivning och därmed fatta gynnsamma beslut. Dock finns det brister med vissa moderna digitala spel gällande ljudlokalisering. Vissa digitala spel saknar nödvändig filtrering och förändring av ljudeffekter i höjdled för att spelaren ska kunna göra korrekta

bedömningar gällande ljudkällans position i den virtuella miljön.

Ett exempel på ett digitalt spel där detta har upplevts är Apex Legends (2019) som är ett gratis Battle-Royal-spel där hundra spelare kämpar för att bli den sista överlevande. Vid flera tillfällen leder den auditiva informationen spelaren till att tro att hen befinner sig på samma våningsplan som fienden, men vid visuell kontroll visar det sig att fienden befunnit sig så mycket som tre våningar över spelaren. Detta är mycket frustrerande och

det förvränger spelarens uppfattning om fiendens position.

Forskning av Farkas (2008) visar ett ökat intresse för användandet av ljudteknik i digitala spel. I synnerhet är det binauralt ljud som blivit uppmärksammat av flera spelutvecklare som valt att implementera detta i sina digitala spel. Några exempel på sådana spel är Hellblade: Senua’s Sacrifice (2017), Counter Strike Global Offensive

(2012) och Sniper Elite V4 (2017).

Farkas (2018) hävdar även att binauralt ljud har bevisats förbättra lyssnares förmåga att lokalisera ljudkällor upp till tio gånger bättre än vid användandet av traditionell

stereoteknik. Detta inkluderar lyssnarens förmåga att bedöma avstånd till ljudkälla såväl som dess position i vertikala och horisontella plan, samt erbjuder högre distinktion mellan ljudkällor som befinner sig framför och bakom lyssnaren.

Denna typ av realistisk ljudsimulation i virtuella miljöer kan även tillföra en starkare känsla av närvaro och inlevelse för spelaren (Kapralos et al. 2008).

(13)

9

Med stöd av tidigare forskning inom binauralt ljud har denna studie syftat till att undersöka hur denna teknik upplevs i jämförelse med traditionellt stereoljud i avseende till spelares förmåga att lokalisera ljudkällor i virtuella miljöer. För att avgränsa arbetet har studien undersökt ljudlokalisering i virtuella våningsplan och hur spelare upplever binauralt ljud i detta avseende. Frågeställningen för undersökningen är följande:

• Hur upplevs binauralt ljud med avseende till spelarens förmåga att lokalisera ljudkällor i olika våningsplan i digitala spel i jämförelse med stereoljud?

Metodbeskrivning

Frågeställningen har besvarats med hjälp av en artefakt. I en digital miljö har

respondenterna interagerat med omgivningen och på så sätt besvarat om den valda mjukvaran för binauralt ljud är fördelaktig i lokalisering av ljudkällor i olika vångsplan i jämförelse med stereo mjukvara. Kvalitativa intervjuer har genomförts för att samla data gällande respondenternas upplevelser och uppfattningar gällande undersökningen.

3.1.1 Artefakt

Denna artefakt har inspirerats utifrån våra egna erfarenheter och upplevelser av vissa FPS- spel. Vi har vid flertal tillfällen upplevt brister och problem med ljudet i spelen, specifikt gällande lokalisering av ljudkällor i höjdled. Detta ledde oss till att vilja undersöka

potentiella lösningar till detta. Vi hittade binauralt ljud och insåg att det fanns stor potential i detta.

Studien är utformad som ett spel i Unity-motorn (2019). Vi har även

implementerat Steam Audio (2019) i projektet för att möjliggöra användandet

av binauralt ljud. Mjukvaran kompletterar den originella ljudmotorn och gör automatiskt komplexa uträkningar gällande ljudet och dess interaktion med den virtuella miljön.

Användaren har dock möjlighet att påverka olika parametrar för att förändra hur ljudet filtreras.

(14)

10

I spelnivån befinner sig spelaren på bottenvåningen i en byggnad med två övervåningar. I de olika våningsplanen finns hål för att simulera trapphus upp till nästa våning. Byggnaden är 40 m² stor, och har en höjd på 9 meter. Varje våning har en takhöjd på 3 meter. Byggnadens väggar, tak och golv håller sig till en rutmönstrad gråskalig textur. De grafiska aspekterna är minimala så att respondenterna inte ska fokusera på det grafiska utan på ljudläggningen.

Kontrollerna för rörelsen av avatarens kropp använder sig av WASD layout, och datormusen används för att vrida avatarens huvud. Respondenterna har använt hörlurar under

testmomentet.

En ljudkälla placeras ut på högsta våningen och rör sig sedan i ett schemalagt mönster genom de olika våningsplanen. Ljudkällan är fotsteg: tunga kängor. Spelaren kan röra sig fritt i miljön och har som enda uppgift att lyssna och försöka lokalisera ljudkällan. Spelaren kan dock inte förflytta sig mellan de olika våningsplanen utan endast röra sig fritt på bottenvåningen. Genom att låta respondenten berätta vilken våning hen tror att ljudkällan befinner sig på kan forskarna undersöka hur effektivt binauralt ljud fungerar i detta

avseende. Samma test genomförs även med traditionell stereoteknik för att se vilken teknik som är mest effektiv.

Kortfattat är målet med artefakten att undersöka hur lokalisering av ljudkällor i olika

våningsplan upplevs med hjälp av binaural teknik i jämförelse med traditionell stereoteknik.

Testet är strukturerat enligt följande:

Respondenterna informeras om artefaktens och undersökningens struktur och

tidsestimering. De tilldelas hörlurar samt får tid att bekanta sig med spelets kontroller.

Testet genomförs två gånger. Första spelomgången använder binauralt ljud och den andra använder stereoljud. Respondenterna får inte veta undersökningens ämnesområde, d.v.s. binaural teknik men blir informerade om att målet med spelmomentet är att lokalisera ljudkällor samt verbalt bekräfta detta till forskarna.

Respondenterna har obegränsad tid att lokalisera ljudkällorna. Under testets gång visas en text mitt i skärmen som frågar respondenten ”Från vilken våning kommer ljudet?”.

Respondenterna besvarar verbalt till forskarna, som antecknar svaren. När den första omgången är avklarad påbörjas nästa omgång med stereoljud. Efteråt påbörjas intervjun som pågår i cirka 20 minuter.

(15)

11 3.1.2 Datainsamling

Målgruppen för undersökningen är spelvana personer med åldern 18–35 år. Personer med erfarenhet av just FPS-spel uppmuntrades att delta i undersökningen. Valet av spelvana personer gjordes för att säkerställa att respondenterna har grundläggande förståelse och förmåga att kontrollera en spelkaraktär i förstapersons vy. Detta underlättar

undersökningen då mindre tid ägnas åt att få respondenten att bekanta sig med kontrollerna. Minimiantalet för undersökningen är 10 personer.

Under pågående spelmoment svarar respondenterna verbalt på frågan som dyker upp på bildskärmen. Deras svar antecknas av forskarna. Efter att spelomgången avslutats

genomförs en intervju med respondenterna. Intervjun är strukturerad och innehåller 10 stycken huvudfrågor, eventuella följdfrågor finns om svaren från respondenterna inte skulle vara tillräckligt beskrivande. Målet med intervjun är att få en uppfattning om hur

respondenterna upplever de spatiala ljuden och vilken spelomgång de föredrar.

Arbetsuppgifterna under undersökningen är uppdelade mellan forskarna. Forskare 1 ansvarar för tidshållning och intervjufrågor. Forskare 2 ansvarar för ljudinspelning av intervjun samt antecknar respondentens svar under spelomgången. Testet och intervjun genomförs på Högskolan i Skövde i sal D104.

Forskarna förhåller sig till Vetenskapsrådets (2002) forskningsetiska principer.

Respondenterna blir informerade om syftet med forskningen, att de själva får bestämma om de vill delta i undersökningen eller inte, att deras personuppgifter inte behandlas av obehöriga eller blir tillgängliga för obehöriga, samt att personuppgifterna och data endast används för undersökningens syfte.

(16)

12

Diskussion

Anledningen till att vi valt att använda en kvalitativ metod är för att den är bättre lämpad när antalet deltagare är få. Eftersom studien riktar sig mot erfarna spelare som har

erfarenhet inom ämnet menar Ejvegård, R. (2009) att intervjuer lämpas bättre än enkäter. I kvalitativa intervjuer kan deltagare vara mer beskrivande gällande sina upplevelser samt utveckla sina svar vilket är gynnsamt för denna undersökning då det är spelares upplevelser som studien grundar sig på. Ejvegård (2009) menar dock att det finns flera olika

”intervjufällor” och att forskare bör vara medvetna om att det finns svårigheter med denna metod.

Exempelvis bör forskarna vara utvilade och förberedda till intervjun för att inte påverka respondenterna genom deras egna beteenden. Om en forskare är stressad och nervös kan detta exempelvis leda till att respondenten uttalar sig kortfattat. En annan sak forskare bör vara medvetna om är hur de formulerar frågorna under intervjun. Frågorna bör inte vara ledande, men samtidigt inte så pass neutrala att respondenterna upplever sina svar som obetydliga.

I vissa avseenden skulle en enkät vara ett enklare sätt att införskaffa data. Enkäter är billigare och mindre tidskrävande än intervjuer. Eftersom enkäter är utformade på exakt samma sätt för varje person är det även lättare att jämföra svaren (Ejvegård 2009). Dock undersöker studien spelares upplevelser och därför är det som tidigare nämnt gynnsamt att använda en kvalitativ metod eftersom detta ger forskarna möjlighet till att ställa

uppföljande frågor.

Ett problem som kan uppstå med den valda metoden är otillräcklig rekrytering av

respondenter. Detta kan bero på att den utsatta tiden för testningen är opassande eller att personer inte är intresserade av att delta över huvud taget.

För att garantera studiens validitet har personer med vana av FPS-spel valts. Detta har gjorts för att fokus ska ligga på ljudet, snarare än grundläggande mekaniker som exempelvis kontroller.

Den ursprungliga idén till artefakten var att spelaren skulle höra ett ljud i den virtuella miljön och därefter sikta och skjuta mot ljudkällan. Testet skulle analysera spelares resultat

(17)

13

gällande reaktionstid och precision i förmågan att skjuta mot ljudkällan med hjälp

av binauralt ljud. Resultaten av detta skulle analyseras och ge studien ett underlag för hur väl binauralt ljud fungerade i avseende till spelares ljudlokaliseringsförmåga. Detta ansågs dock undersöka fel saker då spelarens reaktionstid och precision inte har med

undersökningen att göra, utan visar snarare spelarens vana av användandet av datormus samt reaktionsförmåga. Istället gjordes testet om till att låta spelaren svara på vilken våning hen tror att ljudkällan befinner sig på. Ljudkällan gjordes även osynlig för att säkerställa att spelaren fokuserar på ljudet.

I övrigt kan viss problematik uppstå till följd av mjukvarans inställningar. Mjukvaran tillåter användare att justera olika parametrar för exempelvis eko, rumsklang och ocklusion. Detta kan leda till viss problematik då personer har olika preferenser och uppfattning gällande spatialt ljud i digitala miljöer. I nuläget är mjukvaran inställd efter forskarnas personliga preferenser.

(18)

14

4 Genomförande

Detta kapitel redogör för artefaktens arbetsprocess och utveckling samt en förstudie för att testa artefaktens validitet. Kapitlet inleds med djupgående förklaringar av designval,

inställningar och implementationer för artefakten. Kapitlet avslutas med resultatet av förstudien samt förändringar som har åtgärdats.

Research

Den huvudsakliga inspirationskällan till det här arbetet är som tidigare nämnt egna upplevelser av auditiva problem i spelet Apex Legends (2019). Dessa problem avser

svårigheter att lokalisera ljud i höjdled. Samma problem har även upplevts i andra FPS-spel som exempelvis Counter Strike: Global Offensive (2012) och Player Unknown Battlegrounds (2017).

Problemen uppstår på grund av tekniska begränsningar som leder till svårigheter att urskilja om ljud kommer ovanifrån eller nedanifrån. Egna upplevelser av detta tyder på att det i vissa digitala spel helt saknas funktioner som behandlar filtrering av ljud beroende på dess position i höjdled, och därmed gör det näst intill omöjligt att uppfatta om ljud kommer uppifrån eller nedifrån. Detta kan skapa stor förvirring för spelaren, då ljud är en viktig faktor för att införskaffa information om fiendens position.

Valet att undersöka binauralt ljud har inspirerats av en Youtube video med titeln

“RealSpace 3D v.0.9.9 Audio Demo” (2015). I denna video demonstreras möjligheterna med avancerad ljudteknik i Unity-motorn (2019).

En spelare rör sig genom den virtuella miljön där flera olika ljudkällor har placerats ut.

Spelaren vrider sig i olika riktningar för att visa hur ljudet förändras.

Etik

För att säkerställa att pilotstudien genomfördes på ett korrekt sätt följdes Vetenskapsrådets (2002) forskningsetiska principer. Dessa principer omfattar; informationskravet,

samtyckeskravet, konfidentialitetskravet och nyttjandekravet. Alla respondenter blev informerade om villkoren och rättigheterna innan pilotstudien genomfördes.

(19)

15

Progression

4.3.1 Mjukvara

Arbetet med artefakten började med att hitta samt testa en binaural mjukvara. I det här fallet valdes Steam Audio (2019) på grund av dess tillgänglighet och

implementeringsmöjligheter i Unity-motorn (2019). Tester av mjukvaran gjordes genom att skapa olika virtuella miljöer i Unity (2019) och därefter implementera mjukvaran för att analysera ljudbilden. Exempelvis skapades en spelmiljö i form av en avlång tunnel för att utforska mjukvarans möjligheter och se hur olika inställningar påverkade ljudbilden.

Ytterligare ett test genomfördes i en virtuell miljö med öppen yta. Egna upplevelser av detta var att mjukvaran var mest effektiv i virtuella inomhusmiljöer.

4.3.2 Spelmiljö

Spelmiljön utformades för att simulera en flervåningsbyggnad, se (figur 3). Detta gjordes genom att skapa fyra olika våningar och därefter tillsätta väggar och tak. Utöver detta skapades identiska hål på de olika våningarna med trappor mellan våningarna, se (figur 4).

Detta gjordes i syfte att simulera ett trapphus samt ge ljudet en väg att färdas mellan de olika våningarna. Därefter adderades ett osynligt staket runt hålet på spelarens våning för att förhindra spelaren från att röra sig mellan de olika våningarna.

Figur 3: Bilden visar spelmiljön. Figur 4: Bilden visar konstruktionen av trapporna mellan våningarna.

(20)

16 4.3.3 Steam Audio

Steam Audio (2019) är en mjukvara som syftar till att simulera spatialt ljud. Mjukvaran analyserar den virtuella miljöns geometri och gör därefter komplexa uträkningar på hur ljudet skall filtreras i förhållande till miljön samt lyssnarens position. Mjukvaran kombinerar ocklusion, eko, reflektioner och HRTF för att skapa en inlevelsefull ljudbild.

För att Steam Audio (2019) ska kunna göra korrekta uträkningar på hur ljudet ska filtreras samt uppfattas av spelaren krävs att vissa komponenter adderas till objekten i spelmiljön.

Två av dessa är “Steam Audio Geometry” och “Steam Audio Material”. Kortfattat syftar dessa scripts till att identifiera objektets dimensioner och tillåter användaren att välja vilket material objektet skall simulera. Dessa komponenter påverkar hur ljud interagerar med objekten och är nödvändiga komponenter som måste appliceras på samtliga objekt i spelmiljön.

Utöver detta kräver rörliga objekt ytterligare komponenter för att mjukvaran skall fungera korrekt. Utöver de tidigare nämnda “Steam Audio Geometry” och Steam Audio Material”

adderades även “Steam Audio Dynamic Object” och ”Steam Audio Source”. Dessa scripts syftar till att omvandla objektets ljudkälla till en binaural ljudkälla samt möjliggöra dynamiska uträkningar på ljudet i förhållande till objektets rörelser.

(21)

17 4.3.4 Parametrar och inställningar

Komponenten “Steam Audio Source” ger användaren olika valmöjligheter att påverka ljudet, se (figur 5). Några av de inställningar som användaren tillåts göra avser intensitet av

ocklusion, luftabsorbering och reflektioner. Parametrar tillåter användaren att justera intensiteten av ljudfiltreringarna. För att aktivera objektet som en dynamisk ljudkälla krävs den tidigare nämnda komponenten “Steam Audio Dynamic Object”, se (figur 6).

4.3.5 Scripts

Den första och grundläggande funktionen som skapades för artefakten var spelarens förmåga att röra sig och se sig omkring i den virtuella miljön. En annan funktion som implementerades avsåg information till spelaren i form av text vid testets början och slut, samt kontinuerliga instruktioner under testets gång. Ytterligare en funktion som skapades var rörelsemönstret för ljudkällan. Detta gjordes genom att skapa ett punktsystem där ljudkällan rör sig enligt ett förutbestämt schema mellan punkterna.

4.3.6 Ljud

För att säkerställa att ljuden som används är relevanta för studien lades en enkät upp på hemsidan Ruthless (2020). Enkäten riktade sig till erfarna spelare inom FPS-spel och frågade vilka ljud de ansåg vara viktigast för att lokalisera fiender. Anledningen till att en enkät valdes var för att det är sparsamt och effektivt att administrera (Bryman, A. 2018, s.228).

Figur 5: Inställningar för dynamisk ljudkälla

Figur 6: Exporterings möjligheterna för den dynamiska ljudkällan

(22)

18

Resultatet av enkäten visade att det vanligaste svaret var fotsteg och skott. Vissa

respondenter kommenterade att deras svar beror på vilken typ av FPS-spel det handlar om.

En respondent menade att i spel som exempelvis Overwatch (2016) är det fördelaktigt att lyssna efter spelares förmågor för att lokalisera dem.

Med stöd av enkäten valdes fotstegsljud för artefakten. Fem ljudinspelningar av fotsteg kombinerades och redigerades i Ableton Live (2019) för att skapa en sömnlös loop.

4.3.7 Designval

Under arbetets gång har artefakten genomgått många förändringar i dess design och utformning. Den ursprungliga idén liknade till stor del den slutgiltiga produkten, men skiljde sig främst i hur testet skulle mäta respondenternas förmåga att lokalisera ljuden i den virtuella miljön. Istället för att besvara vilken våning de ansåg ljuden komma ifrån var den ursprungliga idén att de skulle sikta så snabbt som möjligt mot ljudkällan. Detta skulle mäta deras reaktionstid samt träffbild i förhållande till ljudkällan. Efter viss diskussion beslutades att inte använda denna metod eftersom den inte ansågs mäta det som studien avser.

Reaktionstid och precision är intressanta undersökningsområden men besvarar

nödvändigtvis inte problemformuleringen i denna studie. Att undersöka reaktionstid och precision blir snarare ett test i spelares förmåga att reagera och sikta. Eftersom studien syftar till att undersöka hur spelare upplever binauralt ljud i våningsskillnader ansågs denna metod olämplig då den inte förhåller sig till forskningskriterierna för validitet (Bryman, A.

2018, s.50).

Istället beslutades att utforma testet för att säkerställa att spelarnas upplevelser av det binaurala ljudet var det som undersöktes.

Spelmiljön var något som förändrades mycket under arbetets gång. Detta skedde i takt med en ökad förståelse för mjukvarans begränsningar och möjligheter. Exempelvis adderades en källarvåning för att ge en motpol till de övriga våningarna. Storleken på hålen som

simulerade trapphuset gjordes dessutom mindre eftersom den ursprungliga storleken tillät för mycket ljud att passera, vilket resulterade i svårigheter för spelaren att särskilja ljuden i höjdled. För att försöka lösa detta på andra sätt undersöktes även Steam Audio

(23)

19

(2019) inställningar och parametrar för att se om det fanns möjlighet att förstärka

reflektioner eller liknande. Detta ansågs dock problematiskt för studien då forskarnas egna åsikter om hur ljudet bör låta blev inblandade. För att undvika detta ändrades så lite parametrar och inställningar som möjligt.

Pilotstudie

En pilotstudie utfördes för att undersöka artefaktens validitet och funktionalitet. Bryman, A (2018, s.258) menar att pilotstudien säkerställer att surveyfrågorna fungerar samt att undersökningen i sin helhet blir bra.

Pilotstudien genomfördes av fem respondenter som faller in i undersökningens målgrupp, d.v.s. spelare med spelvana. Rekryteringen av dessa skedde via annonsering på sociala medier. Pilotstudien genomfördes på Högskolan i Skövde i sal D107. Testet utfördes genom att låta respondenterna spela och därefter besvara intervjufrågor. Utrustning som användes till testet var en spelanpassad bärbar dator av märket Asus Rog js750, hörlurar av märke Beyerdynamic DT770 Pro samt en datormus av märket Team Scorpion X-Luca.

Respondenterna blev informerade om sina rättigheter och villkoren för undersökningen innan testet började.

För att säkerställa att varje respondent genomförde testet under samma omständigheter och med samma förutsättningar följdes en checklista.

Artefakten innehåller en ljudkälla som flyttar sig mellan de fyra våningarna i spelmiljön.

Ljudkällan presenteras sammanlagt fem gånger på varje våning, och byter alltid position efter varje svar. Respondenterna svarar verbalt till forskarna som antecknar svaren i ett formulär. Målet med pilotstudien var att samla in respondenternas svar gällande vilken våning de tror ljudet kommer ifrån och på så sätt avgöra hur binauralt ljud upplevs i avseende att lokalisera ljud.

Resultatet av pilotstudien visar att respondenterna kunde lokalisera 56% av alla ljudpositioner.

(24)

20

Efter att feedback mottagits och reviderats gjordes ett fåtal ändringar. Dessa innefattade ökad rörelsehastighet för spelkaraktären, en minimap för att ge respondenterna visuell återkoppling till spelmiljön samt en indikator som visar numret för den aktuella frågan.

Knappen för att gå vidare till nästa ljudposition ändrades från mellanslag till numpad enter för att minimera risken att respondenterna oavsiktligt byter ljudposition.

(25)

21

5 Utvärdering

Detta kapitel redogör för undersökningens resultat och slutsatser genom att analysera den insamlade data.

Presentation av undersökning

På grund av omständigheterna kring COVID-19 har undersökningen omstrukturerats för att möta Folkhälsomyndighetens (2020) rekommendationer gällande social distansering.

Undersökningen har anpassats för att möjliggöra genomförande på distans, d.v.s. att respondenten genomför speltestet hemifrån med personlig utrustning. Denna utrustning innefattar dator, datorskärm, hörlurar, tangentbord och datormus.

Undersökningen inleddes med att respondenten anslöt till ett samtal i programmet Discord (2015) tillsammans med forskarna. Respondenten fick en nedladdningsbar länk med

artefaktens filer och informerades om hur denne skulle gå till väga för att starta testet. När testet var avklarat genomfördes en intervju.

Sammanlagt medverkade tio respondenter i undersökningen, varav samtliga ingick i studiens målgrupp. Varje genomförande tog cirka 20–40 minuter beroende på hur snabb respondenten var.

5.1.1 Uträkning av resultat

Uträkningen för resultatet av undersökningen utgår från svaren från de individuella våningarna och har genomförts på följande sätt:

Sammanlagt har 10 respondenter deltagit i undersökningen. Varje respondent svarar på totalt 20 ljudpositioner på olika våningsplan. Varje ljud presenteras totalt 5 gånger per våningsplan. En respondents totala antal svar per test är alltså 20 svar. Eftersom

undersökningen har 10 respondenter innebär totalt 200 svar, och 50 svar per våning. Detta innebär att exempelvis 48 av 50 korrekta svar på en våning motsvarar ett mycket positivt resultat. 48 korrekta svar kan även skrivas om till procent och motsvarar då 96%. Se Appendix F för ytterligare information.

(26)

22

Kvantitativt resultat

5.2.1 Sammanställt resultat av binaural version

Den kvantitativa data baseras på samtliga respondenters resultat i det binaurala testet.

Figur 7 visar respondenternas svar på samtliga våningar i den binaurala versionen. De gröna staplarna visar korrekta svar och de röda visar inkorrekta.

Sammanräknat kunde samtliga respondenter lokalisera 60% av alla ljudkällor i den virtuella miljön. Resultatet visar att majoriteten av respondenterna lyckades lokalisera ljud som kom från våning 2 (V2) samt bottenvåningen (BV), men hade problem med att lokalisera ljud som kom från källarvåningen (KV) och våning 1 (V1), se (figur7).

42

23

43

12

120 60%

8

27

7

38

80 40%

0 20 40 60 80 100 120 140

V2 V1 BV KV Totalt

Antal svar

Antal rätt och fel svar - alla våningar (Binaural)

Figur 7: Diagrammet visar samtliga respondenters korrekta och inkorrekta svar på alla våningsplan.

(27)

23

5.2.2 Individuella resultat av våningarna i binaural version

Resultatet av våning 2 (V2) visar en relativt liten felmarginal i svar. Totalt lyckades samtliga respondenter identifiera 42 av 50 ljudkällor. Resultatet visar inte på någon korrelation mellan inlärning och prestation. Resultatet visar att flest respondenter svarade fel vid det fjärde (#4) tillfället då ljudkällan presenterades, se (figur 8).

Resultatet av våning 1 (V1) visar att samtliga respondenter misslyckades att lokalisera ljudkällan vid det första (#1) tillfället. Därefter visar resultatet spridda svar vid de olika tillfällena. Totalt kunde samtliga respondenter lokalisera 23 av 50 ljudkällor, se (figur 9).

8 9 9 7 9

42 84%

2 1 1 3 1

8 16%

0 10 20 30 40 50

#1 #2 #3 #4 #5 Totalt

Antal rätt och fel på V2

Figur 8: Diagrammet visar respondenters korrekta och inkorrekta svar på V2.

0

4

8 6 5

23 46%

10

6

2 4 5

27 54%

0 5 10 15 20 25 30

#1 #2 #3 #4 #5 Totalt

Antal rätt och fel på V1 (Binaural)

Figur 9: Diagrammet visar respondenters korrekta och inkorrekta svar på V1.

(28)

24

Resultatet av bottenvåningen (BV) visar ett övergripande positivt resultat då samtliga respondenter lyckades att lokalisera 43 av 50 ljudkällor. Resultatet visar att 4 respondenter misslyckades att lokalisera ljudkällan vid det första tillfället. Därefter svarade majoriteten av respondenterna rätt vid resterande tillfällen, se (figur 10).

Resultatet av källarvåningen (KV) visar ett övergripande negativt resultat. Sammanlagt kunde samtliga respondenter lokalisera endast 12 av 50 ljudkällor, se (figur 11).

6 10 9 9 9

43 86%

4 0 1 1 1

7 14%

0 10 20 30 40 50

#1 #2 #3 #4 #5 Totalt

Antal rätt och fel på BV (Binaural)

Figur 10: Diagrammet visar respondenters korrekta och inkorrekta svar på BV.

Figur 11: Diagrammet visar respondenters korrekta och inkorrekta svar på KV.

1 4

0 2 5

12 24%

9 6

10 8

5

38 76%

0 5 10 15 20 25 30 35 40

#1 #2 #3 #4 #5 Totalt

Antal rätt och fel på KV (Binaural)

(29)

25 5.2.3 Sammanställt resultat av stereoversionen

Resultatet från stereoversionen visar att samtliga respondenter kunde lokalisera 48% av alla ljudkällor. Figur 8 visar att respondenterna hade lättare att lokalisera ljud som kom från bottenvåningen (BV), men hade svårigheter att lokalisera ljud som kom från källarvåningen (KV) och våning 2 (V2). Våning 1 (V1) visar att antal korrekta svar och inkorrekta svar är ungefär lika många, se (figur 12).

Figur 12: Diagrammet visar samtliga respondenters korrekta och inkorrekta svar på alla våningsplan.

13 24

48

10

95 48%

37 26

2

40

105 53%

0 20 40 60 80 100 120

V2 V1 BV KV Totalt

Antal svar

Antal rätt och fel svar - alla våningar (Stereo)

(30)

26

5.2.4 Individuella resultat av våningarna i stereoversion

Resultatet av våning 2 (V2) visar att respondenterna kunde lokalisera 13 av 50 ljudkällor.

Övergripande misslyckades respondera lokalisera ljudkällorna vid samtliga tillfällen, i synnerhet det fjärde (#4) tillfället då ingen av respondenterna lyckades svara rätt, se (figur 13).

Resultat av våning 1 (V1) visar att respondenterna kunde lokalisera 24 av 50 ljudkällor.

Övergripande är antal korrekta svar lika många som inkorrekta vid de olika tillfällena, se (figur 14).

Figur 13: Diagrammet visar respondenters korrekta och inkorrekta svar på V2.

2 5

2 0

4

13 28%

8 5 8 10

6

37 74%

0 5 10 15 20 25 30 35 40

#1 #2 #3 #4 #5 Totalt

Antal rätt och fel på V2

6 5

3 5 5

24 48%

4 5 7

5 5

26 52%

0 5 10 15 20 25 30

#1 #2 #3 #4 #5 Totalt

Antal rätt och fel på V1

Figur 14: Diagrammet visar respondenters korrekta och inkorrekta svar på V1.

(31)

27

Svaren från bottenvåningen (BV) visar på ett mycket positivt resultat där respondenterna kunde lokalisera 48 av 50 ljudkällor, se (figur 15).

Svaren från källarvåningen (KV) visar på ett mycket negativt resultat där respondenterna kunde lokalisera 10 av 50 ljudkällor. Under det andra (#2) tillfället lyckades flest

respondenter lokalisera ljudkällan, se (figur 16).

10 10 10 9 9

48 96%

0 0 0 1 1

2 4%

0 10 20 30 40 50 60

#1 #2 #3 #4 #5 Totalt

Antal rätt och fel på BV

Figur 15: Diagrammet visar respondenters korrekta och inkorrekta svar på BV.

1 3 2 2 2

10 9 20%

7 8 8 8

40 80%

0 5 10 15 20 25 30 35 40 45

#1 #2 #3 #4 #5 Totalt

Antal rätt och fel på KV

Figur 16: Diagrammet visar respondenters korrekta och inkorrekta svar på KV.

(32)

28 5.2.5 Binaural vs Stereo

Jämförelser mellan de två versionerna av testet visar att respondenterna lyckades lokalisera ljud mer effektivt i den binaurala versionen än i stereoversionen, se (figur 17). Sammanlagt lyckades samtliga respondenter lokalisera 60 % av alla ljudkällor i den binaurala versionen, medan man lyckades lokalisera 48% i stereoversionen. Övergripande ser svaren i de båda versionerna relativt lika ut, med undantag för svaren gällande våning 2 (V2) i den binaurala versionen som visar att samtliga respondenter lyckats korrekt lokalisera 42 av 50 ljudkällor från denna våning, i jämförelse med 13 av 50 ljudkällor i stereoversionen, se (figur 17).

Figur 17: Diagrammet visar jämförelse mellan resultaten från den binaurala versionen och stereoversionen.

42

23

43

12

120 60%

13

24

48

10

95 48%

0 20 40 60 80 100 120 140

V2 V1 BV KV Total

Jämnförelse binaural vs stereo - korrekta svar

Binaural Stereo

(33)

29

Kvalitativt resultat

Majoriteten av respondenterna upplevde svårigheter att lokalisera ljud i både den binaurala versionen och i stereoversionen. I den binaurala versionen nämnde sex av tio respondenter att de upplevde problem med att urskilja ljud i höjdled. De upplevde att ljuden endast kom ovanifrån, och att inga ljud kom från källarvåningen. I synnerhet var det ljud från våning 1 (V1) och källarvåningen (KV) som var svårast att urskilja. Trots svårigheter att lokalisera ljud i den binaurala versionen svarade fyra av tio respondenter att de upplevde att den binaurala versionen var tydligare och bättre än stereoversionen i avseende att lokalisera ljudkällor.

I stereoversionen svarade majoriteten av respondenterna att man uppmärksammade en distinkt skillnad mellan de två versionerna. Det vanligaste svaret till vilka skillnader

respondenten upplevde var att stereoversionen innehöll mycket mer eko och rumsklang än den binaurala, vilket upplevdes som både positivt och negativt. Sex av tio respondenter svarade att eko i stereoversionen var förvirrande och försvårande för uppgiften. Även i den här versionen upplevde många respondenter problem med att lokalisera ljud från våning 1 (V1) och källarvåningen (KV). Tre av tio respondenter svarade att stereoversionen var bättre än den binaurala versionen i avseende att lokalisera ljudkällor.

Sammanfattningsvis visade intervjuerna att respondenterna upplevde svårigheter med ljudlokalisering i både den binaurala versionen och i stereoversionen. I synnerhet var det avsaknad av distinktion mellan ljud i höjdled och förvirring på grund av ekon som försvårade deras förmåga att lokalisera ljudkällor i den virtuella miljön.

Analys

Den kvalitativa data visar att de flesta respondenterna föredrog den binaurala versionen framför den stereoversionen, men uttryckte att båda versioner var otydliga.

I versionen med binauralt ljud svarade respondenterna rätt på 60% av samtliga ljudpositioner medan man i stereoversionen svarade rätt på 48%.

(34)

30

Svaren var relativt lika i båda versionerna, med undantag för våning 2 (V2). I den binaurala versionen kunde samtliga respondenter korrekt lokalisera 84% av ljudkällorna från denna våning, medan man i stereoversionen endast kunde lokalisera 26 %. Utöver detta visar resultaten från båda versionerna att respondenterna hade stora problem med att lokalisera ljudkällor från källarvåningen (KV). Respondenterna kunde endast lokalisera 24% av

ljudkällorna från källaren i den binaurala versionen, respektive 20 % i stereoversionen.

Slutsatser

Denna studie har syftat till att besvara frågeställningen:

• Hur upplevs binauralt ljud i avseende till spelares förmåga att lokalisera ljudkällor i olika våningsplan i digitala spel i jämförelse med stereoljud.

Det kvantitativa resultatet visar att binauralt ljud inte avsevärt ökar spelares förmåga att lokalisera ljudkällor i olika våningsplan i jämförelse med stereoljud. Däremot pekar data på att respondenterna kunde lokalisera ljudkällor från våning 2 (V2) i en högre utsträckning i den binaurala versionen än i stereoversionen.

I övrigt visade de olika versionerna ingen större skillnad i resultaten av respondenternas förmåga att lokalisera ljudkällor.

(35)

31

6 Avslutande diskussion

Sammanfattning

Detta arbete har syftat till att undersöka hur spelare upplever binauralt ljud i digitala spel. I synnerhet undersöktes om binauralt ljud kan ha en positiv inverkan på spelares förmåga att lokalisera ljud i höjdled. Arbetet har utgått från följande frågeställning:

Hur upplevs binauralt ljud i avseende till spelarens förmåga att lokalisera ljudkällor i olika våningsplan i digitala spel i jämförelse med stereoljud?

För att undersöka detta har kvalitativa och kvantitativa data insamlats från ett speltest samt en intervju som tio respondenter genomfört.

Speltestet utformades för att mäta spelares förmåga att lokalisera ljud i olika våningsplan genom användandet av både stereoljud och binauralt ljud. Spelaren rör sig i en digital miljö som är konstruerad som en flervåningsbyggnad och har som enda uppgift att lyssna efter ljud och besvara från vilken våning hen tror att ljudet kommer ifrån. När testet var avklarat fick respondenterna genomföra en intervju för att undersöka deras upplevelser.

Undersökningen visade att användandet av binauralt ljud inte innebär en stor förbättring i avseende till spelares förmåga att lokalisera ljud i höjdled i jämförelse med stereoljud.

Majoriteten av respondenternas upplevde förvirring både med användandet av binauralt ljud och stereoljud. Majoriteten av respondenterna uttryckte svårigheter och problematik med att lokalisera ljud i höjdled.

Diskussion

I undersökningen framgick det av den kvantitativa och kvalitativa data att skillnaden mellan resultaten från binauralt ljud och stereoljud inte är särskilt stor. Resultatet visade att respondenterna kunde lokalisera 12% fler ljudkällor i den binaurala versionen i jämförelse med stereoversionen. Detta kan dock ha påverkats av flera olika faktorer som kan ha resulterat i missvisande data:

(36)

32

Huvudsakligen gäller detta valet av mjukvara, i det här fallet Steam Audio (2019). Problemet med valet av detta är att det möjligtvis finns andra mjukvaror som är bättre i avseende till studiens syfte.

En annan faktor som kan ha påverkat resultatet är att Steam Audio (2019) tillåter

användaren att justera många inställningar för ljudbilden vilket kan leda till att subjektiva preferenser blir inblandade. Små justeringar kan förändra ljudbilden helt och hållet. Under arbetets gång försökte vi därför förhålla oss så objektivt som möjligt till mjukvarans

inställningar, men det är ändå möjligt att våra egna preferenser har påverkat resultatet. För att optimera inställningarna hade ett alternativ kunnat vara att kontakta utvecklarna av mjukvaran för att få information om hur mjukvaran ska justeras för att passa artefaktens syfte. Detta hade säkerställt att inställningarna var korrekt justerade för ljudlokalisering.

En annan faktor som kan ha påverkat undersökningens resultat är omständigheterna till följd av COVID-19. På grund av rekommendationer från Folkhälsomyndigheten (2020) gällande social distansering anpassades undersökningen till att genomföras på distans.

Detta innebar att undersökningen förändrades på flera olika sätt. Exempelvis kunde vi inte längre välja specifik utrusning för respondenterna, utan fick förhålla oss till deras personliga utrustning. Detta kan ha påverkat resultatet eftersom respondenter möjligtvis använt hörlurar av sämre kvalité än vad studien ursprungligen ämnat att använda.

I övrigt konstruerades speltestet för att vara minimalt krävande i avseende till prestanda, vilket innebar att respondenternas personliga datorer inte borde varit ett hinder eller att de på något sätt försvårat respondenternas uppgift.

Ytterligare en faktor som kan ha påverkat resultatet var valet att låta ljudkällan förbli stationär på respektive våningsplan. Möjligtvis hade respondenterna lättare kunnat

lokalisera ljudet om ljudkällan rörde sig. Kanske hade mjukvarans filtreringar blivit tydligare och därmed förbättrat respondenternas prestation?

(37)

33

Framtida arbete

För att återkoppla till undersökningens frågeställning tycker vi personligen att det är märkligt att moderna digitala spel som exempelvis Apex Legends (2017) har problem

gällande ljudlokalisering. Med tanke på studions storlek är det märkligt hur ljudtekniken inte tycks hålla samma tekniska nivå som exempelvis grafiken.

Farkas (2008) menar att man kan observera många typer av medier där ett specifikt element har utvecklats i en snabbare takt än de övriga. I det här fallet menar han att grafiken i

digitala spel har utvecklats i en betydligt snabbare takt än ljudet och att detta har lett till att ljudtekniken halkat efter.

Det faktum att binauralt ljud i digitala spel är ett relativt nytt fenomen gör det intressant att undersöka. Om undersökningen hypotetiskt sätt hade fortsatt i exempelvis 1–2 veckor hade målet varit att rekrytera fler respondenter för att genomföra testet och därmed öka

undersökningens validitet.

Långsiktigt hade det varit intressant att undersöka och jämföra flera olika binaurala mjukvaror för att utröna vilken som upplevs som mest effektiv för ljudlokalisering.

Undersökningen skulle även kunna bidra till att upplysa spelutvecklare om binauralt ljud och dess potential i digitala spel, samt uppmuntra till vidare utveckling av fältet.

I ett större sammanhang skulle detta kunna bidra till ökad användning av binauralt ljud i digitala spel och möjligtvis innebära en standardisering för denna typ av ljudteknik.

Förhoppningsvis skulle denna ljudteknik minska de auditiva problem som detta arbete har grundats på.

Ur ett samhälleligt perspektiv skulle utvecklingen av binauralt ljud i digitala spel i sin tur kunna bidra till utveckling av verktyg inom andra fält, exempelvis hjälpmedel för personer med hörselnedsättning. Nya upptäckter skulle exempelvis kunna ge upphov till optimering av hörselapparater.

(38)

34 Referenser

Ableton (2019) Ableton Live (10.0.1) [Programvara]. Tillgänglig:

https://www.ableton.com/en/live/

Apex Legends (2019) Electronic Arts [spel]. Tillgänglig på Internet: https://www.ea.com/en- gb/games/apex-legends

Brieger, S & Göthner, F (2011). Spelares inställning till HRTF teknik i spel. Examensuppsats.

Datavetenskap och kommunikation, Kungliga Tekniska Högskolan i Stockholm: Universitet.

Bryman, A. (2018) Samhällsvetenskapliga metoder. Upplaga 2. Liber.

Cheng, C.I. & G.H. Wakefield. (1999) ”INTRODUCTION TO HEAD-RELATED TRANSFER FUNCTIONS (HRTF’S): REPRESENTATIONS OF HRTF’S IN TIME, FREQUENCY, AND SPACE (invited tutorial)” Conference Proceedings

Counter Strike Global Offensive (2012) Valve Corporation [spel]. Tillgänglig på Internet:

https://store.steampowered.com/app/730/CounterStrike_Global_Offensive/

Discord (2015) Discord Inc. (version 0.0.9) [mjukvara]. Tillgänglig på Internet:

https://discord.com/

Doerr, K.U., Rademacher, H., Huesgen, S & Kubbat, W. (2007) “Evaluation of a Low-Cost 3d Sound System for Immersive Virtual Reality Training Systems,” IEEE transactions on

visualization and computer graphics.

Ejvegård, R. (2009). Vetenskaplig Metod. 4. uppl. Lund: Studentlitteratur.

Farkas, T. (2018) ”Binaural and Ambisonic Sound as the Future Standard of Digital Games”

Fakulta masmediálnej komunikácie Univerzita sv. Cyrila a Metoda.

Fay, Todd M., Scott Selfon, & Todor J. Fay (2004). DirectX 9 Audio Exposed: Interactive Audio Development. Plano, Texas: Wordware Publishing.

Folkhälsomyndigheten (2020) https://www.folkhalsomyndigheten.se/smittskydd-

beredskap/utbrott/aktuella-utbrott/covid-19/alla-har-ansvar-att-forhindra-smitta-av-covid- 19/ [2020-05-20]

(39)

35

Hacihabiboglu, H., De Sena, E., Cvetkovic, Z., Johnston, J. & Smith, J. (2017) ”Perceptual Spatial Audio Recording, Simulation, and Rendering: An overview of spatial-audio techniques based on psychoacoustics,” IEEE Signal Processing Magazine.

Hellblade: Senua’s Sacrifice (2017) Ninja Theory [spel]. Tillgänglig på

Internet: https://store.steampowered.com/app/414340/Hellblade_Senuas_Sacrifice/

Hulusic, V., Harvey, C., Debattista, K., Tsingos, N., Walker, S., Howard, D. and Chalmers, A.

(2012) “Acoustic Rendering and Auditory-Visual Cross-Modal Perception and Interaction,”

Computer Graphics Forum.

Kapralos, B., Millios, E. & Jenkin, M. (2008) ”Vitrual Audio Systems” Presence Teleoperators

& Virtual Environments.

Lakka, E., Malamos, A., Pavlakis, K.G. & Ware, J. A. (2018) “Spatial Sound Rendering - a Survey,” International Journal of Interactive Multimedia and Artificial Intelligence.

Lokki, T., Savioja, L., Vaananen, R., Huopaniemi, J. and Takala, T. (2002) “Creating Interactive Virtual Auditory Environments,” IEEE Computer Graphics and Applications.

McGregor, I. (2014) “Comparing Designers’ and Listeners’ Experiences,” AI & SOCIETY:

Journal of Knowledge, Culture and Communication.

PlayerUnknown´s Battlegrounds (2017) PUBG Corporation [spel]. Tillgänglig på Internet:

https://www.pubg.com/en-us/

RealSpace 3D v.0.9.9 Audio Demo (2015) [video]

https://www.youtube.com/watch?v=hmI9-l3a6FM [2020-03-20]

Ruthless (2020) https://www.ruthless.se/ [2020-04-09]

Sanjay, M (2013). Game Programming Algorithms and Techniques: A Platform-Agnostic Approach. Boston: Addison-Wesley.

Siltanen, S, Lokki, T & Savioja, L (2010) ”Rays or Waves?Understanding the Strengths and Weaknesses of Computational Room Acoustics Modeling Techniques” The International Symposium on Room Acoustics (ISRA2010), Melbourne, Australia.

Sniper Elite V4 (2017) Rebellion Developments [spel]. Tillgänglig på Internet:

https://sniperelite4.com/en/

(40)

36

Steam Audio (2019) Vale Corporation [mjukvara]. Tillgänglig på Internet:

https://valvesoftware.github.io/steam-audio/downloads.html [2019-11-21]

Unity (2019) Unity Technologies [mjukvara]. Tillgänglig på Internet:

https://unity3d.com/get-unity/download

Unreal Tournament 3 (2007) Epic Games [spel] Tillgänglig på Internet:

https://store.steampowered.com/app/13210/Unreal_Tournament_3_Black/

Vetenskapsrådet. (2002). Forskningsetiska principer inom humanistisk-samhällsvetenskaplig forskning. Stockholm. Vetenskapsrådet. http://www.codex.vr.se/texts/HSFR.pdf

(41)

I

Appendix A - Frågeformulär.

1. Hur gammal är du?

2. Hur identifierar du dig?

3. Hur många timmar i veckan spelar du datorspel?

4. Hur ofta spelar du FPS-spel?

5. Hur upplevde du den första spelomgången?

5.1. Kan du beskriva vad du hörde?

6. Hur upplevde du lokalisering av ljuden?

6.1. Kan du beskriva varför det var lätt/svårt?

7. Hur upplevde du den andra spelomgången?

7.1. Kan du beskriva vad du hörde?

8. Hur upplevde du lokalisering av ljuden?

8.1. Kan du beskriva varför det var lätt/svårt?

9. Märkte du nån skillnad mellan de två spelomgångarna?

10. Har du upplevt eller hört talats om binauralt ljud tidigare?

11. Skulle du vilja ha den här tekniken i andra spel?

12. Har du någon hörselnedsättning?

References

Related documents

Jämföra denna teknik tillsammans med andra ljuduppsättningar som surround (se ordlista) och HRTF (se kapitel 2.2.3) på testdeltagare för att kunna få en större

Ena gruppen får en explicit inlärning där spelarna får tydliga instruktioner om vad som krävs av dem för att klara objekten, medan den andra gruppen får en öppen

& Høyen (2013) som menar på att ett fenomen aldrig kan beskrivas fullständigt. Utifrån tidigare forskning och resultatet som presenteras i denna studie, kan en möjlig slutsats

Man kan också säga att klichéer är icke-originella eftersom de frekvent används av människor (Cambridge Dictionary 2021). När en kompositör ska skriva musik från ett

Denna studie kan vara av betydelse för både sjuksköterskor, undersköterskor och vårdbiträden inom särskilt boende för att kunna planera och organisera omvårdnaden för att

Genom att se kommunikation och hur det bidrar till arbetsglädje kan intersubjektivitet användas för att förstå att olika sätt att kommunicerar med varandra faktiskt utmynnar

Nackdelen är att det kräver många polygoner för att böja modulen och behålla texturens form men det är värt eftersom man inte behöver använda en egen textur för den böjda

Denna bevisning bör å ena sidan inte läggas någon vikt i vid bedömningen av skuldfrågan, men å andra sidan innebär detta ofta (inte minst bland