• No results found

Skräckljud och utforskning i en virtuell stadsmiljö

N/A
N/A
Protected

Academic year: 2022

Share "Skräckljud och utforskning i en virtuell stadsmiljö"

Copied!
37
0
0

Loading.... (view fulltext now)

Full text

(1)

SKRÄCKLJUD OCH UTFORSKNING I EN VIRTUELL STADSMILJÖ

HORROR SOUNDS AND

EXPLORATION IN A VIRTUAL CITY

Examensarbete inom huvudområdet Medier, estetik och berättande

Grundnivå 30 högskolepoäng Vårtermin 2021

Kristoffer Eriksson

Handledare: Anders Sjölin

Examinator: Jamie Fawcus

(2)

Sammanfattning

Att använda spatialt ljud när det kommer till utforskning av en spelvärld blir allt vanligare. Hur kan skräckljud påverka intresset av utforskning? Genom att blanda maskinljud med djurläten för att skapa abstrakta ljud med olika fokusområden av frekvensinformation för att se hur spelare reagerar när de utforskar en

virtuellstadsmiljö. Beroende på hur frekvensområdet ser ut gör det tydligare att höra ljudet och därefter kunna lokalisera ljudkällan. Genom att använda

spatialljudimplementation och ljudocklusion för att skapa en trovärdig

lyssnarupplevelse för spelaren samt att kunna se hur navigering och lokalisering påverkas. Användning av spatialt ljud och hur olika frekvensområden kan göra det enklare att navigera kan ha stor nytta inom framtida arbeten för att ge individer med nedsatt syn en bättre spelupplevelse.

Nyckelord: Utforskning, frekvenser, skräck, HRTF

(3)

Innehållsförteckning

1 Introduktion ... 1

2 Bakgrund ... 2

3 Problemformulering ... 9

3.1 Metodbeskrivning ... 9

4 Genomförande/Implementation/ Projektbeskrivning ... 13

4.1 Research / Förstudie ... 13

4.2 Arbetsprocess: Ljuddesign ... 13

4.3 Arbetsprocess: FMOD och Unity ... 17

4.4 Pilotstudie ... 21

4.4.1 Pilotstudie: Artefaktens ändringar ... 21

4.4.2 Pilotstudie: Intervjufrågor ... 21

5 Utvärdering... 22

5.1 Presentation av undersökning ... 22

5.2 Analys ... 23

5.3 Slutsatser ... 25

6 Avslutande diskussion ... 26

6.1 Sammanfattning ... 26

6.2 Diskussion ... 26

6.3 Framtida arbete ... 27

Referenser ... 28

(4)

1

1 Introduktion

Med utvecklingen av 3D datorspel så har även utvecklingen av implementering av ljud och musik utvecklats, från att använda stereopanorering av ljudeffekter till att kunna placera ljudkällor direkt i spelvärlden för att öka spelarens upplevelse. Genom att kunna placera ljudeffekter i en spelvärld, skapar det nya möjligheter för interaktion i en virtuell miljö, exempelvis att hjälpa spelare lokalisera fiender i skjutspel till komplexa ljudbaserade pussel.

Användning av spatial-ljudimplementering gör att spelare kan utforska och följa vart ljudeffekterna kommer ifrån, vilket kan leda till intressanta landmärken i spelvärlden eller belöningar för spelaren som utforskare.

En spelgenre som använder spatial ljudimplementering på att sätt för att ge information till spelaren är skräckspel, som använder ljud för att skapa spänning och även varna spelaren för potentiella faror som inkommer, i skräckspel så är det vanligt att inte följa vart ljud kommer ifrån, då det oftast leder till fiender.

Det som har undersökts är att se om ljudeffekter inom skräckgenren kan leda till utforskning i en virtuell stadsmiljö, eller om dessa ljudeffekter inom skräck skapar en motsatt effekt.

Har miljön som ljuden befinner sig i någon direkt påverkan? Då ljudeffekter i ett skräckspel utgår från miljön av spelet som till exempel övergivna rymdstationer, hemsökta hus etc.

Hur påverkar skräckljud spelaren i en väl belyst stadsmiljö när det kommer till att utforska spelvärlden?

Metoden för att utforska problemet har utgått från att skapa en artefakt av en virtuell stadsmiljö med skyskrapor i ett rutnät, där det finns olika ljudkällor placerade som spelar ljudeffekter designade efter monster och andra ljud som kategoriseras som skräckljud.

Testpersonerna har gått runt i spelvärlden och det har dokumenterats hur de agerar när de hörde ljudeffekterna. Med testet genomfört ställdes frågor som sedan blivit analyserat och jämfördes med resultaten från de andra testpersonerna.

(5)

2

2 Bakgrund

Med utvecklingen av 3D datorspel så har det skett ett par stora framsteg när det kommer till implementering av ljud. Den primära metoden är användning av spatialt ljud, vilket innebär att ljuden i spelet blir placerade inom spelvärlden och beroende på lyssnarens position till ljudet så ändras styrkan i volym och hur ljudet är panorerat.

Ett verktyg som är relaterat till spatial ljudimplementering är något som kallas för head-related transfer function eller HRTF som en förkortning.

Ruixing Wu och Guangzheng Yu (2016) förklarar hur HRTF mäter distansen från ljudkälla till lyssnarens högra och vänstra öron och sedan reflekterar den övergripande effekten av filtrering skapat från huvud, överkropp och ytterörat.

Wu och Yu beskriver hur öronen agerar på olika sätt beroende på vart ljudet kommer ifrån inom en 360-graders radie, öronen tar upp olika mängder av information gällande avstånd, rotation och höjd från ljudkälla till öron är information som sparas i HRTF relaterade databaser.

James Broderick, Dr. Jim Duggan och Dr. Sam Redfern (2018) förklarar att människor kan lokalisera ljudkällor i ett 3D rum, trots att de bara ha två öron, detta görs med att hjärnan tar ljuden som når öronen och jämför de med skillnad i tid, frekvens samt ändringar som kan skapas av geometrin av huvud, överkropp och ytteröra.

De beskriver hur HRTF är ett mått av de skillnader vilket sedan kan användas för att digitalt återskapa ljudkällor, dessa mått varierar kraftigt från person till person och därav är det ett stort problem, då det inte är lätt att återskapa dessa mått som fungerar bäst för en person och därför används generaliserade mått inom många HRTF system.

Broderick, Duggan och Redfern går igenom hur spatial ljudimplementering är något som under de senaste åren använts som ett verktyg för att förmedla information till spelaren.

Första-persons skjutspel som Counter Strike: Global Offensive (Valve, 2012) och Overwatch (Blizzard Entertainment, 2015) tas upp som exempel, med olika sätt att implementera spatialt ljud och även de positiva och negativa effekter som kan inträffa.

Användningen av spatial ljudimplementation har beskrivits som något som har hjälpt spelare med lokalisering inom spelvärlden och förbättrat upplevelsen för spelaren inom de tävlingsinriktade spelen. Broderick, Duggan och Redfern beskriver även när Counter Strike:

Global Offensive först fick spatialt ljud implementerat så fick det en negativ reaktion av spelare som är bekant med spelet, denna ändring gjordes fem år efter spelet först blivit släppt, ett par reaktioner som kom med ändringen var att kvaliteten av ljud kändes sämre samt att ljudeffekterna lät underligt när spelaren rörde på sig.

Hörseln är ett av de viktigaste sinnen som människor har, genom ljud så kan mer

information om omgivningen ges, ”Sounds are all around us. Sounds provide information about the world we occupy” (Benjamin Kenwright 2020), genom att förstå varför ljud är viktigt för människor skapas en koppling varför det behövs ljud i spel.

Hörseln liksom känseln har egenskapen av att ta in flera signaler och kunna åtskilja de från varandra, detta gör att ljud inom datorspel får en större roll när det kommer till upplevelsen.

Hörseln kan ta in flera olika källor av ljud vilket gör att i ett spel så kan spelaren höra vad som sker runt omkring tydligt även med bakgrundsljud och musik som spelas.

(6)

3

Kenwright beskriver trots att hörseln är viktig när det kommer till interaktiva miljöer som datorspel så är ljud underutnyttjat till en viss del, även fast ljud och underhållning har gått hand-i-hand länge så upptäcks mer och mer om ljud och det är ett aktivt forskningsområde.

Utöver att ljud kan ge mer information än vad spelaren kan se så med användning av ljud så kan datorspel upplevas mer realistiskt och trovärdig än vad det skulle göra utan ljud.

Upplevelsen av datorspel kan även påverkas om kvaliteten av ljuden uppfattas vara lägre än förväntat, vilket var det som skedde när Counter Strike: Global Offensive implementerade spatialt ljud.

Kenwright förklarar att en funktion som ljud har är att påverka känslor och beteende, denna funktion kommer ifrån att ljud består av massor med information som är inbäddat inom frekvenser, genom att fokusera på olika samlingar av frekvensband tillsammans med volymen av ljudet och kontexten som ljudet är inom så kan idén om specifika känslor framtas.

Blandningen av höga och låga frekvenser kan vara ett användbart verktyg för att påverka spelarens humör, beroende på hur de höga och låga frekvenser kombineras tillsammans med kontexten som tillhör så kan ljud förstärka upplevelsen hos spelaren, vissa kombinationer passar bättre till specifika kontexter och spelgenrer än andra.

Audiovisuell information är ett sätt att förmedla information till spelare i datorspel via ljud vare sig det är av ljudeffekter eller musik utöver grafiska element, dessa ljud kan ge

information till pussel eller ge ledtrådar av att det kan finns något viktigt för spelaren att veta även fast det inte finns något grafiskt visuellt som spelaren kan se.

Audiovisuell information är något som blir allt vanligare inom datorspel med populariteten och växten av open world äventyrsspel.

En genre av datorspel som använder audiovisuell information till sin fördel är skräck, vilket använder ljud för att meddela spelare vart faror eller fiender befinner sig innan det syns för spelaren, detta varnar spelaren ifall de följer vart ljudet kommer ifrån så kommer dem stöta på faror.

Skräckspel som Alien: Isolation (Creative Assembly, 2014) använder ljuddesign primärt för att skapa spänning och atmosfär inom rymdstationen som spelaren befinner sig i, spelet använder spatialt ljud för att förmedla audiovisuell information till spelaren i form med att ha tydliga ljudeffekter när fienden xenomorph rör sig igenom ventilationssystemet, utöver att ytterligare skapa spänning så ger ljuden information om att fienden är nära och därav förbereder spelaren med att vara beredd på att något kan ske.

Att ge spelare information om något som kan ske gör att spelaren får ett val, ska spelaren fly eller försvara sig mot hotet, detta val beror på vilken situationen spelaren befinner sig inom.

Denna användning av audiovisuell information är snarlik hur det kan användas i äventyrsspel, i The Legend of Zelda: Breath of the Wild (Nintendo, 2017) där används audiovisuell information i form av diegetisk musik, ifall spelaren söker efter vart musiken kommer ifrån detta leder till att en karaktär ger en ledtråd till spelaren om utmaningar som finns i området, dessa utmaningar är inte obligatoriska för att klara av spelet utan är något som är frivilligt att göra.

Karen Collins (2008, ss.125,126) beskriver diegetiskt ljud som något som tar plats inom spelkaraktärens omgivning, medan icke-diegetiskt ljud är vad spelaren kan höra som inte finns i spelvärlden som bakgrundsmusik.

(7)

4

Collins förklarar hur spelkaraktären tar fram ett instrument och börjar spela så förvandlas den icke-diegetiska musiken till diegetisk, vilket är vad som sker i The Legend of Zelda:

Breath of the Wild. Till skillnad från hur The Legend of Zelda: Breath of the Wild använder audiovisuell information där musiken i det fallet ger ledtrådar till spelaren om något som är frivilligt att göra, så finns det spel som använder ljud som en primär källa av information.

Ett exempel är Hellblade: Senua’s Sacrifice (Ninja Theory, 2017) där spelets ljud ger

information om huvudkaraktären och vad som sker i världen runt omkring spelaren, utöver de ljud som kan kategoriseras som bakgrundsljud så är de primära ljuden röster som kommunicerar både med spelkaraktären Senua och spelaren.

Att ha ljudeffekter som kommunicerar både med karaktärer i ett spel och spelaren är något som Kristine Jorgensen (2007, ss.76) kallar transdiegetiskt, vilket är linjen mellan om något är diegetiskt eller icke-diegetiskt inte är tydligt nog, ”it is characteristic for transdiegetic sounds that they cannot be posited as clearly diegetic or extradiegetic. Instead, they seem to place themselves somewhere in between the two.” (Jorgensen, 2007, ss.76).

Ett exempel från Hellblade: Senua’s Sacriffice som visar transdiegetiska egenskaper är under ett pussel där spelaren behöver fokusera på vart olika ljud kommer ifrån och en av rösterna som pratar i spelet säger ”shh. Can you hear it? Valravn’s song! You have to focus! Focus!”, detta kan först tolkas som att rösten kommunicerar med Senua då hon svarar att hon hör det, linjen blir otydligare då en spelmekanism som finns i spelet är att fokusera på att rösten säger att fokusera kan tolkas som en ledtråd för spelaren vad som ska göras för att lösa pusslet.

I film så delades ljud upp i vad som finns på skärmen, vad som är utanför och vad som är icke-diegetiskt, dessa tre delar kallades för onscreen, offscreen och nondiegetic (figur 1).

Onscreen är ljud som tillhör något som visas på skärmen exempelvis ifall en vas skulle gå sönder så gör det ett ljud.

Offscreen är ljud som hörs men inte visas på skärmen som exempel ifall ljudet av en vas som går sönder hörs utan att det visas på skärmen så kan det vara att vasen gick sönder i

bakgrunden av scenen, både onscreen och offscreen tillhör världen som utspelar sig i filmen medan nondiegetic är ljud som är utanför världen men ändå tillhör filmen som en

berättarröst.

Dessa tre områden av filmljud var något som Michel Chion (1995, ss.73–79) presenterade för att kategorisera ljud inom film, det blev kritiserat för att vara för grundläggande eftersom det finns scenarion som inte passade in i de tre kategorierna.

Chion uppdaterade sin modell (figur 2) där det lades till tre nya kategorier som gjorde modellen mer komplicerad men rikare när det kommer till att informera hur ljud inom film kan bli kategoriserat, de tre nya kategorier som introducerades var on-the-air, internal och ambient.

On-the-air beskrivs som ljud som kommer från telefoner och radio där källan av ljudet inte är på skärmen men det finns ett föremål som upptar ljudet. Internal är när ljudet kommer från en karaktärs inre som mentala röster eller ett minne vilket blir kallat för subjective- internal sounds, det kan även vara ljud som andetag eller hjärtslag som kommer från karaktären vilket kallas för objective-internal sounds. Den sista av de nya kategorier vid namn ambient är för ljud som upptar en scen utan att ställa frågan vart ljudet kommer ifrån, ljud som fågelsång eller kyrkklockor.

(8)

5

Figur 1 Michel Chion’s onscreen-offscreen-nondiegetic modell

Figur 2 Michel Chion’s uppdaterade modell

Jorgensen (2010) kritiserar användningen av termerna diegetisk och icke-diegetisk när det kommer till förklaring av ljuds funktionalitet inom spel då termerna grundar sig inom film.

Kritiken kommer från att de två medier skiljer sig åt för mycket, med spel som ett interaktivt media så blir linjen med vad som är diegetiskt och vad som är icke-diegetiskt otydligare, förslaget är att uppdatera terminologin som används när det kommer till att förklara ljud inom spel.

(9)

6

Jorgensen förklarar hur denna otydliga linje mellan diegetiskt och icke-diegetiskt genom att beskriva ett scenario som kan ske i spelet The Elder Scrolls III: Morowind (Bethesda, 2002), där spelaren går i en skog och hör musiken vilket ändras, detta varnar spelaren för att en fiende är på väg och därav så kan spelaren agera. Musiken har ingen källa i spelvärlden vilket gör att karaktären inte kan höra det, fast spelaren gör det och kontrollerar spelkaraktären som om den skulle höra att en fiende är på väg. Det som har skett är att ett icke-diegetiskt ljud har påverkat en diegetetisk händelse i spelet, denna typ av interaktion som skapas mellan spelaren och det icke-diegetiska ljuden är vad som skapar otydligheten när det kommer till vad som är diegetiskt och vad som inte är diegetiskt.

Den uppdaterade modellen som Chion (1995) skapat för att kategorisera filmljud visar att termerna diegetisk och icke-diegetisk är mer invecklat än att säga att ljud tillhör filmvärlden eller inte, att kategorisera spelljud på ett liknande sätt har skapats. Denna modell kallas för IEZA (figur 3) vilket delar upp ljud inom fyra grupper som går från diegetiskt till icke- diegetiskt, IEZA står för Interface, Effect, Zone och Affect, de fyra kategorier blir delade inom diegetiskt och icke-diegetiskt samt mellan miljö och aktivitet.

Andreas Westerberg och Henrik Schoenau-Fog (2015) beskriver Interface som när spelaren interagerar med något som inte tillhör spelvärlden och det spelas upp ett ljud, som att navigera i spelmenyn, detta blir kategoriserat som ett aktiv icke-diegetiskt ljud.

Effect är ljud som spelas tillsammans med en händelse som görs i spelvärlden, det kan vara från att skjuta ett pistolskott från pistolen som spelkaraktären har, sådana ljud blir

kategoriserade som aktiv och diegetiskt. Zone är när ljud relaterar till scenen och är en del av det diegetiska, det kan vara ljudet av rinnande vatten från ett vattenfall, sådana ljud är grupperade inom diegetetiskt och miljö. Den sista kategorin Affect beskrivs som ljud som är relaterade till miljön utan någon diegetisk koppling, detta kan vara känslomässig musik.

Baserat på IEZA modellen så framtogs en ny modell som utgår från att skapa bättre separation av ljud i relation till området som ljuden existerar inom, denna modell med namnet FGAMC (figur 4) (Westerberg och Schoenau 2015) som står för Flexible Game Audio Model for Categorization. FGAMC modellen byter ut diegetisk och icke-diegetiskt till game world och game space baserat på Jorgensen (2010, ss.89-91) teori om diegetiska ljud inom spel, game world beskrivs som spelvärlden medans game space är element som tillhör spelet fast inte är direkt i spelvärlden, exempelvis heads-up display.

(10)

7 Figur 3 IEZA modellen

Figur 4 FGAMC modellen

”The way horror computer games are designed to frighten and scare the gamer are relying on the visual and acoustic element simultaneously” (Zhao, Hachisu, Ishii, Kuniyasu & Kajimoto 2012), både synen och hörseln används tillsammans inom spel. Med skräckspel så används ljudeffekter för att förstärka känslan av det visuella, om man tar bort ljudeffekten så har det visuella inte samma påverkan, fast om man tar bort det visuella så kan ljudet fortfarande ha samma påtänkta påverkan. Människor kan uppfatta objekt som inte ger något ljud ifrån sig utan någon visuell information, detta kallas auditory obstacle perception.

(11)

8

I undersökningen av Zhao et al. så används bakgrundsljud som fått olika mängder av ljudets höga frekvenser bortskurna för att se hur de låga frekvenserna påverkar uppfattningen av närmande objekt. Med att göra en highcut av bakgrundsljudet från 10 000 Hz ända ner till 400 Hz, upptäcktes det att med mindre information av höga frekvenser blev upptagandet av vart ljuden kommer ifrån tydligare. Zhao et al. gör en spekulation utifrån resultatet (figur 5) som undersökningen gav, spekulationen är att det finns två faktorer när det kommer till upptagandet av föremål, det ena är ökning i volym och det andra är sänkning av höga frekvenser.

Figur 5 resultat från Zhao et al. undersökning

Genom att blanda organiska element med mekaniska element skapades något som

konstnären H.R. Giger kallade biomekanik, förklarar William Whittington (2007, ss.150), i filmen Alien (1979) hur ljuddesignen skapats utifrån konceptet att blanda organiska och mekaniska element ex. när den nyfödda xenomorph gör ett skrikande ljud innan den flyr.

Skriket är gjort med att blanda diverse ljud från människor, maskiner och djurläten, tillsammans med filtrering och användning av pitch shifter som var gjorda för att skapa en länk mellan maskin och organism.

I början av filmen ”Alien” när rymdskeppet startar upp så hörs ljudet av mekaniska kolvar dessa arbetar i en rytm som påminner om hjärtslag.

Det är något som sedan återkommer när den fullvuxna xenomorph attackerar människorna.

Ljudeffekten av hjärtslag återkommer vid alla möten av xenomorph, förutom i slutet då hjärtslaget har förvandlats till ett mekaniskt pip. ”The lack of the characteristic heartbeat makes the creature’s appearance even more shocking, but also suggests that the creature may have been fusing with the ship’s technology” (Whittington 2007, ss.159).

(12)

9

3 Problemformulering

Denna text går igenom användning av spatiala ljudeffekter i ett skräckspel för att se om ljudeffekter har någon påverkan till utforskning av spelvärlden.

Problemet kommer från att i genrer som äventyrsspel och skjutspel så används spatialt ljudeffekter för att leda och inspirera spelare till att utforska spelvärlden då det oftast leder till någon sorts av belöning för spelaren, medan i skräckspel så används ljudeffekter för att varna spelaren om faror som kan komma om spelaren utforskar vart ljudet kommer ifrån.

Har högfrekventa och lågfrekventa skräckljud någon påverkan till utforskning när det kommer till en virtuell stadsmiljö?

3.1 Metodbeskrivning

Metoden som har använts under denna undersökning utgår från en artefakt vilket ska simulera en stadsmiljö i ett rutnät som har ljudkällor som utger olika ljud inom

skräckgenren, artefakten är till för att se hur användning av audiovisuell information i ett skräckspel kan påverka utforskning.

Användning av spatial ljudimplementering har varit primärt för undersökningen, det gör så att deltagarna har kunnat identifiera var ljuden har kommit ifrån inom en radie. utöver användningen av en artefakt för att besvara frågeställningen så har det ställts

kompletterande frågor till deltagarna, intervjun skedde muntligt efter artefakten genomförts.

Målgruppen inom undersökningen var personer som vanligtvis brukar spela skräck och- äventyrsspel i åldern mellan 20–30. Efter undersökningen genomfördes har de

observationer som gjorts skrivits ner på papper och efter tillåtande från deltagarna har inspelningar av undersökningen gjorts för att förstärka de observationer som gjorts.

Undersökningen har följt Vetenskapsrådet (2017 ss,12–17) om god forskningsetik för att se till att undersökningen genomfördes på ett professionellt sätt och att deltagarna blivit behandlade på ett respektfullt sätt som skyddar deras identitet och förklarar vad deras rättigheter varit inom deltagandet av undersökningen.

Artefakten var gjord i spelmotorn Unity (Unity Technologies, 2019) och använde ljudmotorn FMOD (Firelight Technologies, 2020) där målet var att skapa ett rutnät av skyskrapor, dessa skyskrapor liknar varandra, då fokus inte var på att ha grafiska element som sticker ut för spelaren. I rutnätet så fanns det ljudkällor placerade som spelade upp olika ljud som var designade med inspiration av Alien: Isolation (2014) och andra spel inom genren skräck, dessa ljudkällor var implementerade i FMOD vilket har funktioner som spatial

ljudimplementation och head-related transfer function mått. Att använda spatiala ljudeffekter var en viktig del av undersökningen då det var menat att de som testade artefakten skulle kunnat höra ljuden på avstånd och kunnat lokalisera vart ljudet kommer ifrån.

(13)

10

Ljuddesignen för artefakten har utgått från Zhao et al. (2012) undersökning om låga frekvenser och påverkan när det kommer till uppfattningen av vart ljud kommer ifrån, bakgrundsljudet som var närvarande under undersökningen var ett filtrerat brus som hade en highcut vid 400 Hz, ljuden som var placerade i spelvärlden hade en ökning av frekvenser runt 400 Hz samt även ökning av högre frekvenser runt 1000 Hz för att se om hur de olika ljuden kunde påverka utforskning.

Utöver fokuseringen på specifika frekvensområden så har ljuden varit inspirerade av Alien (1979). Det har blandats organiska och mekaniska element för att skapa biomekanik i ljudform. Ljuden har skapats i FL Studio (Image Line, 2018) som sedan blev

implementerade till FMOD och Unity.

Skapandet av ljuden för artefakten skedde genom att blanda mekaniska ljud som klockor, datorer och motorer, vilket användes för att komma åt rytmiska rörelser i ljudet som skapade en puls. De mekaniska ljuden blandades tillsammans med djurläten som

fågelkvitter och murrande från däggdjur, användningen av djurläten gjordes i åtanke med att rörelser och texturer av ljuden inte är statiska som maskinljud utan det finns små ändringar som sker i pitch.

Valen av de ljud som blandades tillsammans baserades på hur ljuden lät individuellt och sedan matchades med ljud som har olika frekvensområden och vågformer. Att använda flera ljud som inte liknade varandra gjorde att ljuden kunde komplettera varandra och fylla ut områden som inte hade lika klar transient som andra områden av vågformen.

Efter runt tre till fem olika ljud har blivit matchade så blandas dem ihop med användning av EQ, pitch shifter, time stretchning och reverb för att skapa ett nytt ljud som var mer ambient än vad en maskin eller ett djur är. Att skapa ljud som var mer ambient än konkret gjorde att det inte var så tydligt om ljudet är diegetiskt eller icke-diegetiskt.

Artefakten bestod av sex olika ljud, där vart ljud hade fokus inom ett specifikt

frekvensområde, detta skedde genom att göra ändringar i EQ med high och low cuts samt ökningar av vissa frekvensband. Under skapandet av ljuden användes en

spektrumanalysator vilket visade ljudets frekvenser utan att påverka hur ljudet låter. Att vart ljud har haft fokus inom specifika frekvensområden gjorde att ljuden fick sina egna

karaktärister utöver textur och rörelse som kommit från de olika lager som ljuden bestått av, att ha tydligare skildringar av alla ljud gjorde att det kunde bli tydligare att referera till ett specifikt ljud.

Genom att alla ljud för artefakten var skapade på ett liknande sätt, var det en fördel att kunna separera vart ljud vare sig det var genom att lyssna på ljuden eller analysera frekvensspektrumet.

(14)

11

Arbetet utvärderades genom att analysera hur deltagarna agerade i artefakten, när de hörde ett ljud undersöktes det vart ljudet kom ifrån. För att inte påverka hur deltagarna agerade, var det inget förutom kontrollerna för artefakten som blev förklarat innan testet började.

Innan testet startade gavs tillstånd om att spela in skärmen från testpersonen när de testade artefakten för användning som referens, utifrån Vetenskapsrådet (2017, ss.26–27) vilket berättar att vid inspelning så måste först ett godkännande från deltagaren göras och innan så ska en förklaring av användningen av inspelningen nämnas. Vid tillfällen där inspelning inte blivit godkänt har undersökningen endast bestått av nerskrivna anteckningar och

observationer. Testen av artefakten var mellan fem till tio minuter och sedan följde ett dokument av relaterade frågor (Appendix B).

När tio test hade genomförts så togs resultaten av hur de olika deltagarna gjort under testet av artefakten och de olika svar som kommit från frågeformuläret analyserades och

jämfördes, detta gjordes för att se om ljuden hade någon påverkan när det kom till val av utforskning i en spelvärld.

Undersökningen skedde online med användning av verktyg som zoom (Zoom Video

Communications, 2020) och discord (Discord Inc, 2021), detta kunde vara problematiskt då det inte fanns någon standard för hörlurar och att de som var med på undersökningen behövde använda sina egna hörlurar, det kan vara så att frekvensinformation blivit förlorat eller ändrat. Positivt med att det inte fanns någon standard för hörlurarna är att det varit hörlurar vilket deltagarna som testat artefakten kunde ha använts ifall de skulle spela skräckspel.

Innan undersökningen började blev deltagarna informerade om deras rättigheter som deltagare samt kort information om hur artefakten fungerade (Appendix A). Vad undersökningen baserades på förklarades för deltagarna efter den första delen av undersökningen var genomförd, detta gjordes i tanke på att informationen för undersökningen baserades på utforskning av ljudpositioner.

Genom att inte berätta att fokusen för undersökningen var att se om skräckljud kunde tillge intresse för undersökning i en virtuell stadsmiljö, gjorde att det kunde funnits en koppling hur deltagarna utforskade spelvärlden och ifall ljuden gjorde någon påverkan.

Vetenskapsrådet (2017, ss.25) beskriver att ha en öppenhet med vad undersökningen gällde och varför den genomfördes med deltagarna är viktigt, med att berätta varför själva

undersökningen genomfördes fast inte vad som undersöktes var ett sätt att visa för

deltagarna att ingen information om varför de deltog undangöms utan det blev informerat senare eller vid avslutande av undersökningen.

(15)

12

Att artefakten inte hade något visuellt som representerade ljudens ursprung kunde göra att det inte blev lika tydligt vart ljudkällan var, detta i sig kunde både gett positiv och negativ effekt med att deltagarna som gjorde undersökningen kunde försökt leta efter vart ljuden kom ifrån eller att det kunde skapat osäkerhet ifall deltagarna var nära ljudet eller inte. Det kunde uppstå som att något saknades i artefakten, vilket sedan kunde gjort att deltagarna ställde frågor angående det och beroende på hur frågorna blev besvarade kunde förklarat vad undersökningen handlade om och därav påverka resultatet. En lösning för detta problem kunde varit att placera objekt tillsammans med ljudkällan för att skapa en koppling vart ljuden kom ifrån, denna lösning kunde skapat ett annat problem vilket var ifall deltagarna såg objektet före ljudet blev upptaget, kunde gjort att det visuella var vad som ledde till utforskning och inte ljudet.

Genom att intervjun hölls muntligt i stället för att deltagarna skulle fylla i ett formulär skapade möjligheter att deltagarna kunde utveckla sina svar och skapa en diskussion angående upplevelsen av testet och svaren på frågorna. Ifall det hade varit ett

svarsdokument hade sådana diskussioner haft mindre sannolikhet att inträffa. Att hålla diskussioner med deltagarna om artefakten och frågorna gav positiv reflektion av hur ljud kunde påverka till utforskning och framtida arbeten inom det området.

(16)

13

4 Genomförande/Implementation/

Projektbeskrivning

4.1 Research / Förstudie

När det kommer till inspirationskällor för skapandet av artefakten så var den primära källan angående ljuddesign var Ridley Scott’s Alien (1979) och Alien: Isolation (Creative Assembly, 2014), samt Outlast (Red Barrels, 2013) där fokusen har varit på hur ljud hanteras som atmosfär. En annan källa angående inspiration för artefakten har varit Silent Hill (Konami, 1999), där att ha en stad som miljö för ett skräckspel.

4.2 Arbetsprocess: Ljuddesign

Processen av att skapa ljuden för artefakten har utgått från att skapa kortare atmosfäriska ljud, en viktig del av skapandet var att alla ljud skulle vara unika men även ha liknande karaktärsdrag. Ljuden var bearbetade på liknande sätt, från val av ursprungsljud till val av effekter, att bearbeta alla ljud på liknande sätt gjordes för att skapa en enighet av stil på ett sådant sätt att ljuden skulle tillhöra samma värld.

Målet som fanns för ljuden var att de skulle ha en längd runt fem till tio sekunder, ljuden skulle ha olika mängd information av frekvenser inom 400 Hz och 1 kHz, samt att vart ljud skulle innehålla minst ett maskinljud och ett djurläte som grund. Att använda maskin och djurläten som grund för ljuddesignen var baserat på hur H.R. Giger (Whittington 2007, ss.150) blandade mekaniska och organiska element i sina verk. Att använda ljud från diverse maskiner där ljuden har enformiga rörelser som repeteras skapar en känsla som tydliggör att det inte är något levande som låter, genom att sänka ljudets pitch och att sträcka på ljudfilens längd skapades nya klanger som liknar morranden av en tiger eller andra större djur dock så fanns det fortfarande det stela och kalla enformiga karaktärsdragen kvar, vilket tillsammans med användning av EQ och reverb fick ljuden att låta atmosfäriska och abstrakta. Till skillnad från maskinljud har djurläten mer variationer när det kommer till ljudets rörelse och pitch, att det finns variationer och ojämnhet hos ett ljud blir mer distinkta när ljudet blir sänkt i pitch och ljudvågen blir utdragen, fast även bibehåller känslan att ljudet kommer från något levande.

Processen av att skapa ljuden började med att se hur de olika ljudvågorna ser ut, detta gjordes för att leta efter hur ljuden ökar och sänks i volym, ifall det finns diverse rörelser och rytmik som sker (figur 6), genom att se hur ett ljud ser ut gjorde att de andra ursprungsljuden kan väljas med tanke om att fylla ut potentiella tomrum för att utveckla hur rörelsen och rytmiken av ljudet eller att se till att de olika ljuden har liknande vågformer, för att forma ljudet efter en typ av rörelse. En viktig del i detta steg var att ett ursprungsljud inte skulle användas flera gånger, detta tankesätt sträckte sig även ifall ett längre ursprungsljud har blivit klippt och en del inte används, orsaken varför detta var ett val i processen var att skapa ljud som skulle ha egna unika egenskaper och att ljuden ska representera egna ursprungskällor som olika maskiner eller varelser. Att inte använda samma ursprungsljud gjorde att varje ljud kändes som en egen enhet samt att det öppnade upp för experimentering av hur olika ljud kan fungera med varandra.

(17)

14

Figur 6 variationer på ljudvågor

Efter att valet av ursprungsljud blivit gjort började de första steget av manipulering av ljuden göras, detta steg var att sträcka längden på ljuden för att komma åt den tänka längden som skulle vara mellan fem och tio sekunder, användningen av FL Studios time stretching funktion försöker bibehålla original pitchen hos ett ljud (figur 7). Genom att tidstretchningen försöker ha kvar ljudets ursprungspitch skapar möjligheten att manuellt ändra hur pitchen av ljudet ska vara utan att ljudets längd ändras, för att veta hur de olika ljuden skulle justeras inom pitch användes ett spektrogram (figur 8) för att tydligt kunna se hur ljudets frekvenser blir påverkade. Detta var användbart för att se hur ett ljud ändras fast även när annat ljud introduceras in i mixen, vilket behövde tänkas på då med att var ljud skulle innehålla minst två ursprungsljud och att kunna justera de ljuden med varandra för att få en tydligare syn på hur ljudbilden kommer se ut i slutändan (figur 9). Att använda ett frekvensspektrum har varit en viktig roll under hela processen när det kommer till att skapa ljuden, att kunna se hur olika effekter och ursprungsljud agerar och kunnat justera därefter för att nå ett rikt frekvensinnehåll.

(18)

15

Figur 7 Exempel på Time Stretching i FL Studio

Figur 8 Exempel på ursprungsljuds frekvensområde

Figur 9 Exempel av ett färdigt ljud

(19)

16

Efter första steget med time stretching och ändring av pitch introducerades effekter för att ytterligare skulptera ljuden. I början av varje effektkedja användes en equalizer för att ta bort eller sänka mängden av frekvenser som finns och därav passa bättre tillsammans i mixen med de andra ljuden, dessa frekvenser som togs bort var vanligtvis inom det högre registret över 1 kHz, detta gjordes för att lägga mer fokus på det lägre registret och att majoriteten av ursprungsljuden har blivit justerade mer åt det lägre och mellanregistret vilket gjorde att vissa av ljuden hade väldigt lite information av höga frekvenser. En stor användning av EQ utöver att kapa vissa frekvenser var att göra en manuell fokusering av specifika områden, detta gjordes med att höja frekvensbanden med mindre bandbredd samt att använda EQ som ett bandpass filter, detta gjordes med tanke på att fram höja vissa frekvenser. Att använda EQ som ett verktyg för att skulptera ljuden var användbart när det kom till att utföra tanken som var för artefakten att vart ljud skulle ha mer fokus inom vissa frekvensområden för att se ifall hur utforskning av spelvärlden påverkas, samt att fokusera på frekvenser under 1 kHz gör att filtret som sker i FMOD för att skapa ljudocklusion inte gör någon större påverkan av ljudens karaktär.

Ytterligare skulptering av ljuden skedde genom att användningen av formant filter, frequency shifter samt reverb. Användningen av formant filter gjordes på ljud som var enformiga och inte hade mycket rörelse hos sig, denna användning resulterade i en ökning inom vissa frekvenser beroende på vad för vokal som är inställd, ifall ett ljud uppfattades som för statiskt användes LFO för att ändra vilken vokal som ska användas, utöver att få ljudet att inte kännas enformigt har användningen av formant filter ökat känslan om att ljudet kommer från en varelse. Att använda frequency shifter på vissa ljud gjordes för att justera frekvenserna på en mindre skala samt att denna justering gjorde att de påverkade ljudet fick en mer distinkt placering i mixen (figur 10), även om ändringen var på en mindre skala var användningen av en frequency shifter något som gav ljuden mer karaktär (figur 11). Användningen av reverb utgick inte efter att ändra hur ljudets karaktär är, den primära användningen var att skapa känslan av en atmosfär som håller i samman ljuden.

Figur 10 Spectrum exempel på ett ljud utan frequency shifter

(20)

17

Figur 11 Spectrum exempel på ljud med frequency shifter

Under processen av att skapa ljuden kom ett hinder fram, detta var att två urspungsljud efter blivit manipulerade fungerade enskilt med ett tredje ljud fast inte med varandra, detta kunde lösas genom att välja ett av de två ljuden för att mixa ihop med det tredje. Problemet med denna lösning var att ett av ljuden var maskinbaserat medan det andra var djurbaserat, med att poängen för ljuden var att blanda ihop maskin och djur var detta något som inte fungerade.

Lösningen som gjordes var att använda en vocoder där båda ljuden blir manipulerade med, ett av ljuden fick funktionen som en modulator för det andra ljudet. Att använda de två bearbetade ljud som modulator och carrier i en vocoder gav intressanta resultat där beroende på vilket ljud som är modulator och vilket som är carrier ändrade ljudbilden på olika sätt, resultatet var ett ljud som både lätt unikt och även fungerade i en mix med det tredje ursprungsljudet. Genom att lösa detta problem med att ha två olika ljud som inte helt fungerar med varandra, gjorde att användningen av vocoder introducerades till arbetsprocessen när det kändes att det behövdes användas för att få fram ett slutresultat.

När processen av att skapa sex distinkt unika ljud var färdiggjord samt att ett vitt brus som har haft ett lowpass filter som tar bort frekvenser över 1 kHz blivit skapat, var nästa steg att skapa spelvärlden och lägga in ljuden.

4.3 Arbetsprocess: FMOD och Unity

Början av processen för att skapa artefakten utgick av att skapa en testmiljö vilket bestod av ett plan och ett par kuber som spelaren kunde navigera runt (figur 12), detta gjordes för att testa rörelse och kameran av spelaren. När spelkaraktärens rörelse fungerade som den ska började uppbyggnaden av en större yta som spelaren kan röra sig runt och navigera mellan de olika kuber som var placerade inom ett rutnät, dessa kuber var gjorda för att representera skyskrapor och därav sträckte sig högt upp. I denna version av spelvärlden fanns det större öppna ytor som var placerade runt omkring, dessa öppna ytor hade funktionen av att lätta på känslan av klaustrofobi med att spelaren konstant var omringad av höga rektanglar och med att ha öppna ytor gav spelaren en chans att slappna av, de hade även funktionen att ha ljudkällor i vilket spelaren skulle höra när de var nära.

(21)

18

Figur 12 överblick av artefaktens första version

När det kommer till spelmiljön i Unity gjordes det en stor ändring av det visuella, denna ändring var att ta bort kuberna som var placerade i ett rutnät för att skapa en virtuell stadsmiljö, dessa kuber var inte texturerade utan hade ett grått material tillagt av Unity när ett 3D objekt blir skapat. Det som byttes ut mot kuberna var en 3d modell av en byggnad som är texturerad, när modellen blivit implementerad i Unity påbörjade uppbyggnaden av spelvärlden, modellen av byggnaden hade en mer avlång rektangulär geometri än vad kuberna hade vilket gjorde att miljön kändes mer klaustrofobiskt (figur 13). Valet att gå från icke- texturerade kuber till en modell av en byggnad gjordes för att göra artefakten mer intressant och roligare för deltagarna att spela, genom att det är en modell som repeteras skapas en obehaglig stämning tillsammans med att världen slutar med en mur av byggnaden som omringar och att himlen är grå får artefakten att representera skräckgenren tydligare. Att implementera grafiska element i artefakten utöver att skapa en stämning för spelaren i stället för att de själva ska fantisera att det är en stad som de utforskar är att tydligare berätta att ljuden som finns runt om kring tillhör världen. I den uppdaterade spelvärlden är de större öppna ytorna från den första versionen borttagna, detta gjordes med tanke på hur stämningen som skapades med att ha samma byggnad repeteras flera gånger tills spelaren når muren som går runt alla byggnader gav en större känsla av skräck än vad det skulle göra med att ha öppna ytor som sker ibland. Att de öppna ytorna från första versionen hade spatiala ljudkällor gjorde att det blev enklare att förutspå ett mönster av vart ljuden kommer ifrån, med den nya versionen är det svårare för spelaren att förutspå vart de olika ljudeffekterna kommer ifrån där med att det inte finns ett konkret mönster att utgå efter, vilket i sig leder till större påverkan av utforskning då spelaren behöver röra sig runt i världen för att upptäcka vart ljuden kan komma ifrån.

(22)

19

Figur 13 överblick av artefaktens andra version

En ändring som gjordes från den första versionen till den andra var att i första prototypen fanns det ljud som spelades upp till höger eller vänster av spelaren när de passerar kuberna som, detta är något som inte är med i den andra versionen därav att de skulle vara större fokus på spatiala ljudeffekter än normalt panorerade ljud. I tanke på att det visuella ändrades för att efterlikna något som är mer trovärdigt av ett spel, därför var det även i åtanke om att ljuden även ska vara mer trovärdiga för ett spel och inom 3D spel är spatialt ljud vanligare nuförtiden.

Efter att ljuden blivit tillagt i spelvärlden upptäcktes det att även fast en byggnad var mellan spelaren och ljudkällan så lätt ljudet som det gjorde utan en byggnad i mellan, detta orsakades för att FMOD kollade efter avstånd och höger, vänster position. För att lösa detta används det en inbyggd parameter i FMOD som kollar efter spelarens kamerariktning och jämför det med vart ljudkällan är, beroende på graden av riktningen tilläggs en ändring i volym, om kameran är riktad direkt mot ljudkällan ändras inget och är vid 0 dB medan om kameran är riktad att ljudkällan är bakom spelaren sänks volymen till -6 dB. För att lösa hur ljuden låter när en byggnad är mellan spelaren och ljudkällan skapades ett script vilket skickar linjer från ljudkällorna när spelaren är nära (figur 14), dessa linjer kollar ifall det finns något som bryter deras väg, ifall det sker att linjerna möter ett föremål aktiveras en parameter i FMOD.

Beroende på hur mycket av linjerna bryts justerar parametern värdet på ett lowpass filter, ifall linjerna är helt brutna av en byggnad som är mellan spelaren och ljudet kapar filtret av frekvenser högre än 1 kHz, detta var ett val som utgick efter hur ljuddesignen har blivit gjort med att ha mer information i frekvensspektrumet under 1 kHz och hur Zhao et al. (2012) undersökning fick fram resultat att mindre information i det högre frekvensregistret har en starkare påverkan att lokalisera ljudkällan. Utöver att ett lowpass filter justeras även volymen av ljudet till -6 dB om linjerna märker av att en byggnad är mellan spelaren och ljudkällan, detta var ett val som utgick efter känsla då målet var att sänka ljudets volym på ett sådant sätt att spelaren fortfarande kan höra ljudet. Att spelarens riktning mot ljudkällan även justerar volymen fanns i åtanke där av att de två olika justeringar av volymen påverkar varandra och därav gör att deltagarna får en ändrad ljudbild beroende på riktning och ifall byggnader är i vägen, vilket skapar en tydligare vägledning till spelaren var ljudet kan komma ifrån eftersom ljudet kommer vara högre i volym ifall kameran är riktad mot ljudkällan.

(23)

20

Figur 14 ljudocklusion exempel, röda linjer blir filtrerade i FMOD

Varje ljudkälla har likadana inställningar i FMOD, som parameternamn och maxdistansen för spatializer effekten, detta är gjort för att scriptet som hanterar ocklusion av ljuden ska fungera för alla ljud i åtanke på ifall det skulle lägga till ytterligare fler ljud i spelet. Med att spatializer effektens maxdistans (figur 15) är samma för var ljud gör att spelaren kan börja höra ljuden spelas när de är inom en specifik längd från ljudkällan, ifall ljuden hade haft olika inställningar hade det gjort att spelaren behöver vara närmre eller längre bort för att höra ljuden i sig kan vara mer trovärdigt med att beroende på källan av ljudet har olika volymer beroende på vad det är som gör ljudet, fast i detta fall var något som inte var eftersträvat då det passade bättre att ha samma distans då ljuden i sig är mer abstrakta och ambient och inte för att det inte finns något specifikt som ska göra ljuden i spelvärlden.

Figur 15 Maxdistansen från FMOD representerad som en sfär

(24)

21

4.4 Pilotstudie

En pilotstudie gjordes med två deltagare, med mål av att se ifall artefakten och intervjufrågorna gav eftersträvade resultat för undersökningen samt för att se ifall de behövdes ändras för att bidra till målet med studien.

4.4.1 Pilotstudie: Artefaktens ändringar

När testet av artefakten gjordes fanns det inga instruktioner eller begränsningar för deltagarna utan de fick röra sig fritt inom världen tills alla olika ljud hade blivit upptäckta, under intervjun nämndes det att det skulle behövas något som meddelar för spelaren att de har hittat en ljudkälla, då det inte var tydligt nog ifall spelaren var tillräckligt nära ljudet eller inte. En annan viktig punkt från testen av artefakten var att det behövdes ett tydligt avslutande mål för spelaren så att de kunde veta ifall testet är genomfört. För att lösa dessa problem implementerades det att när spelaren går in i de osynliga objekten var ljudkällorna utgår ifrån aktiveras rad kod för att avsluta ljudet och sedan förstöra objektet. Genom att stänga av ljudet skapades en indikator för spelaren att källan för detta ljud har blivit upptäckt, utöver att avsluta ljudet skedde ett tillägg av en räknare vilket introducerades i med att artefakten skulle hålla kolla på hur många ljud som blivit hittade och förstörda. Att förstöra själva objektet som ljudkällan tillhör gjordes för att inte spelaren ska aktivera ljuden igen efter att gått ifrån och sedan kommit tillbaka, samt att inte spelaren ska stå och försöka aktivera ljudkällan igen vilket då kunde göra att räknaren adderade tal när den inte skulle. Genom att en räknare introducerades kunde ett mål med artefakten skapas och detta blev att när alla sex ljud blivit förstörda stängdes spelet av sig själv. Utöver att artefakten behövde ett mål behövdes även en begränsning för att inte deltagarna spenderar för lång tid i spelet, denna begränsning skapades i form av en extern timer som introduceras innan testet startar.

4.4.2 Pilotstudie: Intervjufrågor

Efter att deltagarna för pilotstudien genomförde artefakten ställdes frågor (Appendix B) för att se hur de relaterar till vad som skedde under testet. Det som uppstod efter att intervjun blivit genomförd var att frågornas ordning behövdes ändras, därav att vad som först ställdes handlade direkt om testet och sedan gick över till mera generella frågor om hur deltagaren agerar när de vanligtvis spelar datorspel. Utöver att ändra ordningen på frågorna som ställs, blev två ytterligare frågor tillagda, ena frågan handlade om att deltagarna skulle beskriva de ljud vilket som lät mer obehagligt, skrämmande eller intressant medan den andra handlade om att förklara vad undersökningen gått ut på och ifall nya tankar kommit fram (Appendix C).

(25)

22

5 Utvärdering

5.1 Presentation av undersökning

Undersökningen skedde över internet med användning av programvaran Discord, där deltagarna delade deras skärm när de testade artefakten samt var röstsamtal för intervjun.

Undersökningen hade elva deltagare sammanlagt vilka var i åldrarna mellan 20 till 30 och hade en vana vid att spela datorspel. Innan undersökningen började blev deltagarna informerade om deras rättigheter som deltagare (Appendix A), efter detta kunde de starta artefakten och starta skärmdelning. När artefakten och skärmdelningen var startad introducerades timern vilket var satt på 3 minuter, ingen annan information gavs ut utöver att en timer startar. Genom att det fanns två sätt för deltagarna att klara av artefakten, detta var ifall tiden gick ut samt ifall alla ljudkällor blivit förstörda, skapade ett mätbart och genomförbart sätt att analysera resultaten. Under deltagarnas utförande av undersökningen dokumenterades ifall ett ljud blivit upptäckt och ifall ljudkällan blivit avstängd. Alla olika ljud var designade med att fokusera på olika områden av frekvenser (Appendix D)

När tiden av timern gått ut eller ifall alla ljud hade blivit hittade, avslutades den första delen av undersökningen och gick över till intervjufrågorna. Alla som deltog blev presenterade samma frågor (Appendix C) i ordning, formulering av vissa frågor justerades lite beroende på responsen som blev given. Ett exempel av en ändring i formulering var fråga nummer 8 vilket handlar om att beskriva de ljud som deltagaren tyckte lät mest skrämmande eller obehagligt, en av deltagarna nämnde att de inte tyckte något av ljuden lät skrämmande eller obehagligt utan mer intressant, i stället för att inte ställa den frågan ändrades formuleringen så att personen kunde beskriva de ljud som lät mest intressant enligt dem.

Två av deltagarna hade problem med att spela artefakten och dela skärmen samtidigt, i stället för att inte göra undersökning som den var planerad så fick de spela artefakten själva och efter tiden gick ut gick över till intervjun vilket de fick först berätta vad som hade skett så detaljerat som de kunde, efter förklaringen av vad som skedde utfördes intervjun som planerat. Att välja att utföra undersökningen även fast att det inte var utfört som planerat gjordes för att deltagarnas synpunkter var fortfarande relevanta för undersökningen som en helhet.

(26)

23

5.2 Analys

Utifrån att deltagarna spelat igenom artefakten skapades en sammanfattning av vad som skett, där dokumentation av vilka ljud som hade blivit hittade och avstängda var inom fokus.

Dokumentering visade vilka ljud som var tydligast att hitta (figur 16), det ljud som blev hittade och avstängda markerades som grönt medan de ljud som blev hittade fast inte avstängda markerades som gult, ifall ett ljud inte upptäcktes gjordes inte någon markering. Det första ljud som alla deltagare hittade samt avslutade var ljud 1 vilket hade än större frekvensfokus vid 200–300 HZ, detta ljud var även närmst spelarens startposition vilket gjorde att majoriteten av deltagarna hittade det ljudet först. Det var en av deltagarna som hittade det ljudet senare i undersökningen detta skedde av att en annan riktning togs när de först började utforska världen. Ljud 2 upptäckte alla deltagare fast två lyckades inte hitta vart ljudkällan befanns sig, detta ljud hade en stor fokus inom 500 Hz fast var även ett av ljuden som hade minst mängd frekvenser efter 1 kHz. Ljud 3 var det en deltagare som inte hittade ljudkällan medan resterande gjorde, detta ljud angående frekvenser hade inte någon direkt utstickande fokuspunkt utan var mer jämnt fördelad från 50 Hz till 2 kHz samt mindre höjningar vid 100 Hz och 400 Hz. När det gäller ljud 4 var det två deltagare som inte upptäckte ljudet när de gjorde undersökningen, ljudet i sig hade minst information inom det låga registret där det var en stor avskurning från 200 Hz och neråt, utöver att ha mindre låga frekvenser hade ljudet även en höjning runt 700 Hz. De ljud som blev upptäckt minst var ljud 5, vilket det var tre personer som inte upptäckte ljudet medan en upptäckte ljudet fast hittade inte var ljudkällan fanns, ljudet i sig hade frekvensinformation genom hela registret från 20 Hz till 20 kHz utöver det så hade ljudet en minskning av frekvenser från 400 Hz till 1 kHz. Det sista ljudet lyckades alla deltagare upptäcka och avsluta ljudkällan förutom en, ljudet hade en ökning vid 500 Hz och 700 Hz.

Figur 16 Resultat från genomförandet av artefakten

Ljudens placering (figur 17) i spelvärlden upptäckte några av deltagarna var nära en korsning av byggnader och sedan berättade att när de upptäckte den kopplingen var det enklare att navigera från ljud till ljud, ljud 5 och ljud 6 var de två undantagen med att ena var placerat i ett av hörnen av kartan medan den andra var placerad bakom en byggnad som var nära kartans avspärrning.

(27)

24

Figur 17 ljudkällornas placering i spelvärlden, X var startpositionen

Ljud 5 som hade minst mängd av frekvensinformation vid 400 Hz till 1 kHz var det ljud som minst blev upptäckt, en av deltagarna som hörde ljudet försökte hitta källan efter att upptäckt att när spelaren går in i källorna avslutas ljuden, även med denna information klargjord hittades inte källan innan tiden gick ut. När det kommer till de deltagare som hittade och avslutade ljud 5 var det att de hade gått tillräckligt nära ljudet och hört att det finns ett ljud i närheten och därefter letat efter det, ett annat sätt som några deltagare gjorde när de upptäckte ljud 5 var att de följde väggen av byggnader och sedan när de kom nära det hörnet där ljudet var placerat upptäcktes ljudet. Majoriteten av deltagarna upptäckte ljud 1 först, vilket även var de ljud som var närmast spelarens startposition, två utav deltagarna upptäckte ljud 6 först och en upptäckte ljud 3 först, detta skedde beroende på hur deltagarna valde att gå.

Vid intervjudelen svarade alla deltagare att de brukar utforska datorspel men det beror på vilken genre, med skräckspel var utforskning något som inte var lika eftersökt och när det gällde så gjordes det varsamt. När frågan om vad som skapade intresset för utforskning var ett vanligt svar att eftersöka någon sorts av belöning för spelaren att få efter att ha utforskat. En annan vanlig inspiration till utforskning var visuellt intresse, ifall det såg ut att finnas ett sätt att ta sig till en plats eller om det var något som såg ut att sticka ut, var beskrivet som en motivationsfaktor. Ljud hade inte lika stor faktor som det visuella har när det kommer till utforskning utan av de elva deltagare för undersökningen så var tre som nämnde ljud när de svarade på frågan.

Frågan angående ifall ljuden hjälpte till att utforska artefakten svarade deltagarna positivt, en förklaring av varför ljuden hjälpte till att utforska var att det var något som skedde medan de gick runt, ljuden agerade som en fokuspunkt för deltagarna. Den större mängden av deltagare beskrev att de försökte hitta vart ljuden kom ifrån när de väl hörde dem, samt att det var tydligt att hitta majoriteten av ljudkällorna.

(28)

25

En av deltagarna som inte kunde dela med sig av sin skärm under spelandet av artefakten i intervjudelen beskrev hur de inte försökte hitta vart ljuden kom ifrån utan gick ifrån ljuden när de hördes, angående förklaringen varför detta skedde så beskrevs det att var deltagarens vanliga reaktion gällande skräckljud och att deltagaren associerar det med fara.

I frågan om ljuden lät obehagliga eller skrämmande var det majoriteten av deltagarna som höll med om det och vissa beskrev att de förväntade sig att något skulle dyka upp och skrämmas när de väl var tillräckligt nära ljudkällan och var förvånade att inget dök upp, de deltagare som förväntade att något skulle ske var även mer vaksamma när de utforskade då de inte ville bli skrämda. En vanlig kommentar angående ljuden var att de ljud som var mer abstrakta och svårare att skapa en egen visuell koppling till uppfattades som mer obehagliga än de ljud som hade någon sorts igenkännbarhet. Utöver att inte kunna skapa en visuell koppling till vad ljuden tillhörde var en återkommande kommentar om att ljud som lät mer åt monsterhållet eller mänskligt var mer obehagligt.

En sak som påpekades var att ljuden lockade några av deltagarna även fast de tyckte ljuden lät otäckt, en faktor av det var att deltagarna beskrev ljuden som intressanta samt även att det inte fanns något annat att göra än att leta efter ljuden.

Ett par av deltagarna beskrev att det var enklare att lokalisera ljuden tack vare att de kunde höra på ett ungefär var ljuden kom ifrån och därefter försöka hitta den exakta positionen, det beskrevs även att vissa av ljuden var svårare att hitta var det kom ifrån när deltagaren var nära ljudkällan och försökte se vart ljudet kom ifrån i stället för att röra sig mot ljudet.

5.3 Slutsatser

Undersökningen har visat hur ljud kan leda till större intresse av utforskning, där frekvensinnehåll och spatial implementation har en påverkan. De ljud som hade fokus inom 400 Hz till 1 kHz var tydligare att hitta ljudkällorna för, undantaget var när ett ljud hade mindre låga frekvenser vid 100 Hz området. När ett ljud hade mindre information vid 400 Hz till 1 kHz gjorde att ljudets position inte var lika tydlig som de ljud vilket hade mer information inom de området. Högre frekvenser över 1 kHz hade inte lika stor påverkan av lokalisering av ljudkällor som frekvenser vid 100 Hz hade, däremot för att göra ljudet tydligare att upptäcka behöver det finnas lite frekvensinformation över 3 kHz. Baserat på ljuden inom denna undersökning är frekvensområdet för att tydligast höra vart ljudens position befinner sig är 100 Hz till 5 kHz med ökning vid 300–500 Hz. Att använda spatial ljudimplementation som HRTF och ljudocklusion skapar tydlighet när det kommer till att lokalisera ljudkällor däremot är det inte ett felfritt system och kan göra att när spelaren är nära källan men inte exakt vid den kan det bli svårare att höra vart ljudet kommer ifrån.

(29)

26

6 Avslutande diskussion

6.1 Sammanfattning

Undersökningen har utgått ifrån frågeställningen hur påverkar skräckljud utforskning inom en virtuell stadsmiljö, med användning av bakomliggande forskning om HRTF (Head-Related Transfer Function), diegetiskt ljud inom spel och lokalisering av ljud med höga frekvenser avskurna. Undersökningen utfördes med användning av en artefakt skapad som ett rutnät av byggnader vilket är omringade av en mur av byggnader, i staden fanns sex ljud runt placerade.

Ljuden var designade genom att blanda maskinljud och djurläten för att skapa stilen biomekanik, därefter hade varje ljud olika mängder av frekvensinformation. Artefakten var skapade med mål om att se vilka ljud som deltagarna kan upptäcka samt avsluta genom att utforska och lokalisera ljudkällorna, därefter analysera vilka ljud blev upptäckta och vilka inte blev samt att se ifall det fanns en korrelation till frekvensinnehållet av ljuden. Resultat från undersökningen visar att det är svårare att lokalisera ljud när det är mindre låga frekvenser runt 100 Hz samt att det behövs frekvenser över 3 kHz för att enklare kunna uppfatta vart ljud kommer ifrån, undersökningen visade även att frekvenser som ligger runt 300–500 Hz även har en påverkan till lokalisering av ljud.

6.2 Diskussion

I texten av Zhao et al. (2012) undersökte dem hur olika mängder av avklippningar av höga frekvenser påverkar spelarens uppfattning av närmande objekt, genom att basera en del av undersökningen efter det kunde en uppfattning av vad olika frekvenser gör för att lokalisera.

I deras text fick de fram resultatet att en avklippning runt 400 Hz gav bäst respons av närmande objekt, detta speglades i denna undersökning vilket gav resultatet att det ljud med större informationsmängd vid det frekvensområdet var enklare för deltagarna att upptäcka.

Att låga frekvenser spelar en stor roll till människors uppfattning av ljuds position varken rörande eller statisk, med resultatet från denna undersökning skapades en ny diskussion om att höga frekvenser även har en del att göra med när det kommer till att spelare ska lokalisera ljudkällor, där av att ljud som hade mindre information av det högre registret inte var lika tydligt att hitta som ljud med frekvenser i det högre registret.

Undersökningen kan agera som ett hjälpmedel för att utveckla datorspel som är bättre anpassade för individer med nedsatt syn, då artefakten använder sig utav spatiala ljudimplementationer och genom att undersöka hur tydligt det är att lokalisera ett ljud med olika frekvensinnehåll när en spelare utforskar. Genom att skapa en koppling till frekvenser och utforskning kan utvecklas vidare för att spelare inte ska behöva förlita sig av det visuella inom datorspel för att kunna uppskatta upplevelsen av verket.

(30)

27

6.3 Framtida arbete

Framtida arbete för undersökningen skulle vara att göra om testet med samma ljud fast ändrade positioner i spelvärlden för att se ifall liknande resultat sker eller om det är några ändringar som skapas av resultatet, om det ljud som blev hittat minst byter placering med det ljud som blev hittat mest, skulle det skapa annorlunda resultat eller ge liknande. Att göra om testet med ändringar som vart ljudet är placerade skulle förstärka tanken att olika frekvenser är enklare att höra och upptäcka exakt position än andra, det skulle även kunna visa att frekvenserna inte har stor påverkan utan resultatet sker på grund av hur deltagaren navigerar i spelvärlden. Något annat som framtida arbeten inom denna undersökning kan göra är att ha tydligare skildringar inom frekvenser för att kunna skapa starkare kopplingar till hur ljud och frekvensinnehållet kan påverka spelares intresse av utforskning. En sak som skulle behövas bli implementerat i artefakten är karta ut spelarens rörelse och kamerariktning i relation till de olika ljuden, detta kan vara användbart för att ytterligare se hur spelare reagerar när de hör ett ljud samt att se hur enkelt eller svårt det var att upptäcka ljudets källa.

För framtida arbete skulle undersökningen kunna göras med två grupper, där ena gruppen brukar spela datorspel medan den andra gruppen inte gör det, att bilda två grupper kan göra att deltagarnas handlingar i artefakten kan variera beroende på hur vana de är med

datorspel. Att få fram olika tankesätt och reaktioner utöver individer som spelar datorspel är något som kan vara positivt för undersökningen för att se hur ljud och frekvenser påverkar utforskning beroende på individen, kommer resultaten bli varierade beroende på vanan av datorspel.

Artefakten och undersökningen kan bidra till framtida utveckling för att skapa atmosfäriska skräckspel, där utforskning har större roll, att kunna designa ljud som har funktion av att få spelaren att utforska kan hjälpa det överblickande målet som skräckspel har med att skapa spänning och obehag för spelaren fast ändå tillge ett intresse för att fortsätta spela även efter spelaren blivit skrämd. Utöver skräckgenren så kan informationen om hur olika frekvensområden påverkar spelares intresse av att vilja veta vad som låter och vart det kommer ifrån, göra att spelutvecklare får mer val som kan fungera att fånga spelarens intresse av att något av värde eller en fiende kan finnas i närheten fast inte inom den förbestämda vägen.

(31)

28

Referenser

Alien. (1979). [film]. Ridley Scott. Los Angeles: 20th Century Studios.

Alien: Isolation. (2014). [spel]. Horsham: Creative Assembly.

Broderick, J. Duggan & J. Redfern, S. (2018). The Importance of Spatial Audio in Modern Games and Virtual Environments. Tillgänglig på Internet: https://ieeexplore-ieee- org.libraryproxy.his.se/stamp/stamp.jsp?tp=&arnumber=8516445 [hämtad februari 16, 2021].

Chion, M. (1995). Audio-Vision: Sound on Screen. New York: Columbia University Press. ss.

73–79.

Collins, K. (2008). Game Sound: An Introduction to the History, Theory, and Practice of Video Game Music and Sound Design. Cambridge, MA: MIT Press. ss.125–126.

Counter Strike: Global Offensive. (2012). [spel]. Bellevue: Valve.

Discord Inc. (2021). Discord. (74659). [mjukvara].

Firelight Technologies. (2020). FMOD. (2.00.08). [mjukvara].

Hellblade: Senua’s Sacrife. (2017). [spel]. Cambridge: Ninja Theory.

Image Line. (2018). Fl Studio. (20.7.1). [mjukvara].

Jorgensen, K. (2010). Game Sound Technology and Player Interaction: Concepts and Developments. Grimshaw, M. (red.) Time for a new Terminology: Diegetic and Non- Diegetic Sounds in Computer Games Revisited. Hershey, PA: Information Science Reference. ss. 78–97.

Jorgensen, K. (2007). What are Those Grunts and Growls Over There?: Computer Game Audio and Player Action. Tillgänglig på Internet:

https://kristinejorgensen.w.uib.no/files/2018/12/jorgensen-thesis.pdf [hämtad februari 16, 2021]. ss. 76.

Kenwright, B. (2020). There’s More to Sound Than Meets the Ear: Sound in Interactive Environments. Tillgänglig på Internet: https://ieeexplore-ieee-

org.libraryproxy.his.se/document/9098089 [hämtat februari 18, 2021].

Outlast. (2013). [spel]. Montreal: Red Barrels.

Overwatch. (2015). [spel]. Irvine: Blizzard Entertainment.

Silent Hill. (1999). [spel]. Chuo City: Konami.

The Elder Scrolls III: Morowind. (2002). [spel]. Rockville: Bethesda.

The Legend of Zelda: Breath of the Wild. (2017). [spel]. Kyoto: Nintendo.

Unity Technologies. (2019). Unity. (2019.2.21f1). [mjukvara].

(32)

29

Vetenskapsrådet. (2017). God Forskningssed. Tillgänglig på Internet:

https://www.vr.se/analys/rapporter/vara-rapporter/2017-08-29-god- forskningssed.html [hämtat mars 18, 2021] ss.12–28.

Westerberg, A. Schoenau-Fog, H. (2015). Categorizing Video Game Audio: An exploration of auditory-psychological effects. Tillgänglig på Internet: https://dl-acm-

org.libraryproxy.his.se/doi/epdf/10.1145/2818187.2818295 [hämtad februari 17, 2021].

Whittington, W. (2007). Sound Design & Science Fiction. Austin, University of Texas Press.

ss.147–165.

Wu, R & Yu, G. (2016). Improvements in HRTF Dataset of 3D Game Audio Application.

Tillgänglig på Internet: https://ieeexplore-ieee-

org.libraryproxy.his.se/stamp/stamp.jsp?tp=&arnumber=7846601 [hämtad februari 16, 2021].

Zhao, S. Hachisu, T. Ishii, A. Kuniyasu, Y & Kajimoto, H. (2012). Augmentation of obstacle sensation by enhancing low frequency component for horror game background sound.

Tillgänglig på Internet: https://dl-acm-

org.libraryproxy.his.se/doi/epdf/10.1145/2160125.2160149 [hämtat februari 17, 2021].

Zoom Video Communications. (2020). Zoom. (5.3.1). [mjukvara].

(33)

I

Appendix A - Till Deltagarna Innan Testet

1. Godkänner du inspelning av undersökningen som kommer ske, inspelningen kommer användas som referens för analys och dokumentation av resultatet av testet. Inga personuppgifter kommer dokumenteras, information som ålder och kön kommer grupperas med andra deltagare för att ge ett mellanvärde utav deltagarna som varit med på undersökningen. Efter analys och dokumentation av resultatet kommer inspelningen permanent tas bort.

2. undersökningen kommer utföras inom två delar, den första delen är en form av ett datorspel vilket använder tangenterna W, A, S och D för att kontrollera rörelse inom spelvärlden, datormusen används för att kontrollera vart spelets kamera riktas mot.

För att avsluta testet så används tangenten Esc. Efter genomförandet av spelet så kommer det gå över till en intervju vilket är den andra delen av undersökningen, i intervjun så kommer frågor som relaterar till den första delen. I den andra delen av undersökningen så kommer handlingen av undersökningen förklaras och gå igenom.

3. Avslutande av undersökningen är något som du har full kontroll över, rätten att avsluta undersökningen vid en tidpunkt är något som finns under hela processen av undersökningen vare sig det är i första delen eller andra delen.

4. Denna undersökning görs som en del utav ett examensarbete för en kandidatexamen.

(34)

II

Appendix B - Intervjufrågor för pilotstudie

1. Upplevde du att de olika ljuden hjälpte till att utforska spelvärlden?

2. Försökte du hitta vart ljuden kom ifrån?

3. Var det tydligt att hitta vart de olika ljuden kom ifrån?

4. Upplevde du ljuden som skrämmande eller obehagliga?

5. Är utforskning av en spelvärld något du vanligtvis gör när du spelar datorspel?

6. Är utforskning inom skräckspel något du gör?

7. Vad skulle du säga har störst inflytande till intresset av utforskning?

References

Related documents

Förhoppningen var att studenterna skulle diskutera kurslitteraturen i förhållande till den egna texten men också hjälpa varandra i arbetet att hitta kopplingar till

I pedagogiska sammanhang kan aktörerna bygga upp en gemensam förståelseram för gesternas betydelse utifrån sina förkunskaper, och detta visade sig också tydlig i resultaten

I föregående presentation av de olika spelardiskurserna har vi sett hur ekvivalenskedjor byggt upp olika identiteter kring mästersignifikanten spelaren. Genom att

Undertecknade wåga härigenom ödmjukast an- hålla, att äktenskapet oss emellan måtte warda genom laga skildnad upphäfdt; då drista såsom bevekande skäl anföra

Den folkliga och populära musiken har i alla tider tagit plats direkt i stadsrummen, men inte minst sen 1950-talet har populärmusiken bidragit till att musiken inte

Denna studie visar att det finns en tendens att kunna använda ljud som är kopplade till objekt för att förklara dess funktion och på så sätt vägleda spelaren

För att ge resultat från två olika modeller med två olika ansatser kommer den ena modellen att ta hänsyn till ett tidsseriefenomen som kallas kointegration medan den andra

Det här var en av få låtar där jag kände att det inte gjorde någonting att jag loopade samma komp från början till slut.. Det kändes som om jag hade andra element som dolde