• No results found

Utvärdering av ljudkvalitet i fordon: projektering av metod och lyssningsrum

N/A
N/A
Protected

Academic year: 2022

Share "Utvärdering av ljudkvalitet i fordon: projektering av metod och lyssningsrum"

Copied!
44
0
0

Loading.... (view fulltext now)

Full text

(1)

2006:039 CIV

E X A M E N S A R B E T E

Utvärdering av ljudkvalitet i fordon

Projektering av metod och lyssningsrum

Jon Hansson

Luleå tekniska universitet Civilingenjörsprogrammet

Medieteknik

Institutionen för Systemteknik Avdelningen för Medieteknik

(2)

Abstract

Sound affects us more or less when we choose between different products. The product sound is an indicator of the product’s quality for the consumer. To find out if you are on the right track during the development of a product you can perform listening tests to ensure that you have reached the standards and expectations of consumers. In this paper, the acoustic factors, which influence the authenticity of sound within a room, are

described for different methods of reproduction of sound. Depending on whether speakers or just headphones are to be used, totally different requirements are set for the acoustics in the room. An analysis of the absorption needed was carried out so that the requirements set by the European Broadcasting Union were met for two different cases.

In case one the reproduction of sound only takes place with headphones and subwoofers and in case two with four speakers. The absorption analysis was performed with software called CATT-Acoustics in which the listening room and absorption was modelled. The software enabled the amount and placement of the absorbers to be determined so that the requirements for listening conditions used to assess small sound discrepancies were fulfilled. If speakers are to be used, it is important to study the proportions of the room to control the standing wave patterns that will be created. Otherwise, the standing waves will influence the authenticity of the reproduced sound in a negative way. Therefore an optimization test of the listening room proportions has been performed to ensure an acceptable room response. The result of the optimization test gave three alternative room dimensions, with considerably different floor areas, in which the best room response will be created according to the used weighting criteria.

(3)

Sammanfattning

Ljud påverkar oss vid valet av produkt mer eller mindre medvetet och är en indikator på en produkts kvalitet. Vikten av god ljudkvalitet hos företagets produkter är alltså en faktor att konkurrera med. För att veta om att man är på rätt väg vid produktutveckling är därför lyssningstest ett sätt att försäkra sig om att man uppnått konsumenternas

förväntningar angående ljudkvaliteten hos sin produkt. I detta arbete beskrivs de akustiska faktorer som påverkar ljudets autenticitet vid återgivningen vid de olika återgivningsmetoder som går att använda sig av vid lyssningstest. Beroende på om hörlurar eller högtalare används ställs olika krav på akustiken i rummet. En

absorptionsdimensionering har genomförts, både för ett rum som är avsett för hörlurar med bashögtalare och för ett rum med fyra högtalare, så att de krav som är specificerade i European Broadcasting Unions standard för kritiska lyssningsrum efterföljs.

Absorptionsdimensioneringen genomfördes i programvaran CATT-Acoustics med vilket lyssningsrummet modellerades och absorbenter placerades ut och tillräcklig

absorptionsfaktor bestämdes så att kravspecifikationen efterföljs. Skall högtalare användas krävs att rummets proportioner studeras så att de stående vågor som uppstår inte kommer att påverka återgivningen negativt. Därför genomfördes även en optimering av rumsdimensioner för att finna det rum som ger rakast rumssvar. Resultatet av denna optimering gav tre alternativa rum av olika storlek vilka enligt använd kriterieviktning är de bästa.

(4)

Innehållsförteckning

1 Inledning ... 1

1.1 Bakgrund... 1

1.2 Syfte ... 1

1.3 Avgränsningar... 1

1.4 Fordonsakustiska förutsättningar... 1

2 Analys ... 3

2.1 Vikt av inlevelse och autenticitet... 3

2.2 Lokalisering av ljudkällor ... 3

2.3 Återgivningsmetoder... 4

2.3.1 Hörlurar... 4

2.3.2 Högtalare... 5

2.3.2.1 Tvåkanalsystem med och utan crosstalk cancellation ... 5

2.3.2.2 Femkanalsystem och Ambisonics... 7

2.3.2.3 Fyrkanalsystem med CCS... 8

2.3.2.4 Bashögtalare... 8

2.3.2.5 Kort sammanfattning av återgivningsmetoder... 9

2.4 Akustik i lyssningsrummet ... 9

2.4.1 Låga frekvenser... 9

2.4.1.1 Hur rumsmoder påverkar ljudbilden... 10

2.4.1.2 Dimensionering av lyssningsrum... 13

2.4.1.2.1 Dimensioneringsmetod ... 13

2.4.1.2.2 Resultat dimensionering... 17

2.4.1.3 Efterklangstid... 19

2.4.1.4 Absorption och diffusion ... 20

2.4.1.5 Diffusion ... 21

2.4.2 Höga frekvenser ... 21

2.4.2.1 Tidiga reflektioners påverkan på ljudbilden ... 22

2.4.2.2 Absorptionskrav beroende av återgivningsmetod... 23

2.4.2.2.1 Absorptionskrav för hörlurar plus bashögtalare ... 24

2.4.2.2.2 Absorptionskrav högtalarrum ... 24

2.4.2.2.3 Absorptionsdimensionering – Hörlurar och bashögtalare ... 26

2.4.2.2.4 Absorptionsdimensionering – Högtalare ... 26

2.4.3 Övriga krav och rekommendationer ... 31

3 Slutsats ... 32

4 Källförteckning ... 33

5 Bilagor... 35

5.1 Bilaga 1, Echophon Master A, ljudabsorptionsfaktor... 35

5.2 Bilaga 2, RPG Inc. Modex Corner, absorptionsfaktor... 35

5.3 Bilaga 3, Modell för lyssningsrum... 36

5.4 Bilaga 4, Identifiering av tidig reflex i CATT-Acoustic... 40

(5)

1 Inledning

1.1 Bakgrund

I en allt mer globaliserad värld tvingas företag till att konkurrera med allt fler aspekter hos deras produkter. Ljud påverkar oss mer eller mindre medvetet och blir därför en av dessa aspekter att konkurrera med. Begreppet ljudkvalitet tror många bara handlar om en produkt låter mycket eller lite, numera innefattar begreppet ljudkvalitet konsumentens syn på det ideala ljudet. En produkt ska inte längre bara vara tyst utan den ska låta "rätt".

Ljudet hos en produkt bör till exempel ge information om produktens funktionalitet samt skapa rätt associationer. Många vill till exempel höra smutsen sugas upp genom

dammsugarslangen så att de vet att något händer och köper man en sportbil vill man att motorn ska låta stark och kraftfull och inte som en tvåtaktare. Ljudet är därför en

indikator för konsumenten som förmedlar ett budskap om produktens kvalitet och således begärlighet.

När allt större resurser ansätts åt att utveckla en bra ljudkvalitet hos en produkt är det viktigt att ta reda på hur kunden/användaren vill och förväntar sig att produkten skall låta.

För att utvärdera ett framarbetat ljud kan detta således behöva testas mot testpersoner som tillhör den tänka målgruppen. Idag finns väl beprövade metoder att analysera och koppla olika ljudkomponenter hos en produkt mot psykoakustiska mätstorheter för att på så sätt utvärdera om modifikationen är kostnadseffektiv.

1.2 Syfte

Syftet med examensarbetet var att utreda hur ett rum bör utformas akustiskt för bruk vid kvalitativa bedömningar av lastbilsljud och dessutom att beskriva de omkringliggande rumsakustiska egenskaperna som påverkar ljuduppfattningen. Olika tekniker för ljudåtergivning ska även introduceras och de rumsakustiska krav som ställs vid tillämpningen av dessa förklaras.

1.3 Avgränsningar

Syftet med detta arbete är inte att få fram ett detaljerat slutgiltigt förslag till hur Scania skall utföra sina lyssningstest utan visa på vilka möjligheter som finns och beskriva förhållanden omkring dessa. Förslag på rumsdimensioner som lämpar sig för ljudåtergivning med högtalare kommer dock att redovisas.

Beräkning av rumssvar, för att hitta en optimal lyssningsposition för en person och bashögtalarkonfiguration, med programvaran Room Optimizer eller annan metod har ej genomförts inom detta examensarbete då detta skulle resultera i en detaljlösning för ett specifikt rum, lyssningsposition och högtalaruppställning. Detta genomfördes ej på grund av att det slutgiltiga användningsområdet är okänt, rumsdimensioner, antal lyssnare etc.

1.4 Fordonsakustiska förutsättningar

I lastbilshytten uppstår en rad olika tonkomponenter vilka upplevs särskilt starka. Den starkaste tonkomponenten är oftast tändfrekvensen vilken är en multipel av varvtalet och

(6)

de cylindrar som är i förbränningsfas under ett rotationsvarv. Tändfrekvensen blir 3 x motorvarvtalet/60 för en rak sexcylindrig motor och 4 x motorvarvtalet/60 för en V8.

Tonkomponenterna är alltså inte knutna till en given frekvens på grund av att hastigheten och varvtalet förändras. Detta leder till att hela tonerna uppkommer i hela

frekvensområdet 20-20000Hz. Därför har ingen särskild hänsyn tagits till dessa

tonkomponenter i detta arbete. Viss hänsyn har dock tagits till de resonanser som uppstår i hytten. Beroende på längdförhållandena inom hytten uppkommer stående vågor vid olika frekvenser. Då Scania använder sig av ett antal olika hytter i olika storlek leder detta till att resonanser uppstår vid flera olika frekvenser. De lägsta resonanserna för de Scanias tre största hytter, Normal, Highline och Topline, uppkommer uppskattningsvis i intervallet 65-110Hz.

(7)

2 Analys

2.1 Vikt av inlevelse och autenticitet

Ett lyssningstests resultat beror bland annat på hur autentisk upplevelsen blir för personen som utför de subjektiva bedömningarna. Beroende på motivet för lyssningstestet kan en minskning av autenticiteten vara acceptabel. Ska generella bedömningar angående produktens ljudkvalitet genomföras kan det vara viktigare med förhöjd upplevelse än etthundraprocentig autenticitet. Generellt omfattar den upplevda autenticiteten av ett ljudtest inte bara ljudkvaliteten utan även den visuella stimulans som testpersonen utsätts för [S+01]. Testpersoner kan till exempel anmärka på att ljudet de hör i hörlurar har för starkt basljud trots att styrkan kalibrerats korrekt. Denna färgning beror på att det ljud testpersonerna hör, inte stämmer överens med den visuella upplevelsen. Bäst resultat fås således om lyssningstestet utförs i den miljö ljudet är inspelat [S+01]. Tester i den naturliga miljön kan vara omöjligt eller svårt på grund av praktiska omständigheter men så hög visuell naturtrogenhet som möjligt bör eftersträvas.

Det finns flera olika sätt att tillhandahålla testpersonen med visuell stimulans, allt från att genomföra testet i en så kallad mock-up till att presentera en bild från den miljö ljudet uppstår i på en skärm. En mock-up är en mer eller mindre naturtrogen modell av den testade miljön, i detta fall en lastbilshytt. Upplevelsen i en mock-up kan göras mer eller mindre naturtrogen med hydraulik och omslutande videodisplayer, utöver naturtroget ljud. En mock-up ger förutom större naturtrogenhet också möjlighet att testa en rad andra aspekter hos en produkt så som komfort och design. Det är dock ett förhållandevis dyrt alternativ jämfört med en enkel display eller skärm där rörliga bilder som stillbilder presenteras.

2.2 Lokalisering av ljudkällor

Ett återgivet ljuds upplevda naturtrogenhet påverkas till stor del av hjärnans förmåga att lokalisera de olika ljudkomponenterna korrekt.

Hjärnans använder olika metoder för att lokalisera en ljudkälla, bland annat skillnad i tid, Interaural Time Difference, och styrka, Interaural Level Difference, mellan de två

öronen. För lokalisering av ljud av låga frekvenser, det vill säga under 1500Hz, används främst ITD, vid 500Hz och uppåt används ILD (effektivast över 3 kHz). För att lokalisera ljud i medianplanet (se Figur 1) fungerar dessa metoder mindre bra på grund av att ljudet når bägge öronen samtidigt, det vill säga vid samma tidpunkt och därmed samma styrka, för att lokalisera ljudkällans placering används då istället HRTF, Head Related Transfer Function. HRTF beskriver kroppens (torso, huvud och öronmussla) inverkan på ljudet innan det når trumhinnorna. Hjärnans förmåga att lokalisera en ljudkälla med hjälp av HRTF blir som mest effektiv över 4 kHz då våglängden är tillräckligt liten för att öronmusslan ska kunna påverka den fysiskt [Don02]. HRTF’s utnyttjas bland annat genom att rotera huvudet, vilket leder till att ett öra hamnar i ”skugga”, det vill säga en skillnad i tid och styrka. Olika personer har olika HRTF’s vilket leder till ett visst fel då ljud spelas in i en persons öron för att sedan återges för en annan. De konsthuvud som finns på marknaden idag kommer med ett sorts genomsnittligt öra, det vill säga inte helt autentiskt.

(8)

Figur 1, Median-, horisontal- och frontalplan förklarade. [Don02]

När motstridig information kommer från ITD och ILD tolkas det som ett mellanting mellan de två, det vill säga om ITD pekar på att källan är något till vänster och ILD antyder att källan finns till höger, kan det tolkas som om källan finns i mitten [HC72].

Det har också visats att när ITD och ILD visar olika källplaceringar så dominerar den lågfrekventa ITD-signalen lokaliseringen [WK92]. Vid användning av HRTF’s och hörlurar återstår framför allt problem med lokalisering framåt/bakåt. Källor lokaliserade framför lyssnaren för en tendens att placeras bakom lyssnaren.

2.3 Återgivningsmetoder

I detta avsnitt kommer de olika återgivningsmetoder som finns att tillgå vid lyssningstest kort att redovisas.

2.3.1 Hörlurar

Hörlurar används flitigt vid lyssningstest idag och har en rad fördelar då man till exempel spelat in material binauralt. Vid binaural inspelning, via konsthuvud eller i örongången hos en testperson, inkluderas människokroppens påverkan på ljudet. Om återgivningen sen sker via hörlurar återges ljudet vid i princip på samma plats i förhållande till kroppen där ljudet spelades in, detta leder till hög naturtrogenhet vid ljudåtergivning. En stor fördel med att använda hörlurar vid jurytestning är att alla testpersoner får möjlighet att bedöma samma ljud. Ytterligare en betydande fördel är att det går att testa flera personer samtidigt vilket kan reducera tiden de ofta tidsödande lyssningstesten tar. Hörlurar ställer dessutom betydligt mindre rumsakustiska krav på lokalen som lyssningstestet genomförs i, jämfört med kraven på en lokal där lyssningstest ska genomföras med hjälp av

högtalare. Detta kommer att behandlas i detalj senare i rapporten. De problem som dock kan uppstå vid ljudåtergivning med hörlurar är bland annat lokaliseringsproblem och fysisk påverkan.

Undersökningar har visat att så kallade front-back fel, det vill säga när ljud som

härstammar framifrån upplevs komma bakifrån och vice versa, är fyra gånger så vanligt med hörlurar som i frifält. Up-down fel händer samtidigt 7 gånger så ofta med hörlurar [Don02]. Dessutom uppstår in-head fel, vilket är när ljudkällan upplevs vara inuti huvudet.

(9)

En orsak till att ljud som härstammar framför lyssnaren inte uppfattas korrekt är att källan följer med huvudets rörelser då hörlurar används, vilket inte sker naturligt. Vid

ljudåtergivning med lurar saknar mottagaren alltså förmågan att vrida på huvudet för att lokalisera källan med hjälp av HRTF’s, vilket kan leda till front-back fel. Huvudrörelser (rotation) är kritiskt vid lokalisering av ljud direkt framför och bakom huvudet. Dessutom kan, som nämnts tidigare, skillnader mellan lyssnarens och konsthuvudets HRTF skapa fel. En del omkastningsfel tros bero på bristfällig visuell stimulans, när hjärnan saknar den visuella bilden av källan framför sig tror hjärnan automatiskt att källan ligger bakom huvudet, det vill säga utanför synfältet [Rum01].

En del personer är inte vana vid att ha hörlurar på huvudet, denna relativt påtagliga fysiska inverkan kan därför påverka testpersonens upplevelse och därmed testresultatet.

Ännu en nackdel med ljudåtergivning enbart med hörlurar är att lyssnaren inte fysiskt känner ljudet (främst låga frekvenser) i kroppen, vilket dock kan avhjälpas genom att komplettera med bashögtalare.

2.3.2 Högtalare

En generell fördel med alla högtalarsystem är att lyssnaren inte utsätts för någon fysisk påverkan vilket ett par hörlurar på huvudet gör. Lyssnaren omsluts dessutom av och får chans att fysiskt känna ljudet. Det finns ett otal olika högtalaruppställningar med allt från en till flera tiotal. Vilket av dessa system som bör användas beror bland annat på

användningsområdet. En betydande nackdel med att använda högtalare är att rummet då påverkar ljudsignalen och stor omsorg måste läggas på att kontrollera detta. I detta kapitel beskrivs kort ett par av de vanligast förekommande metoderna.

2.3.2.1 Tvåkanalsystem med och utan crosstalk cancellation

För traditionell stereo med två högtalare placeras alla ljudkällor i ljudbilden genom nivå- och tidsskillnader mellan de två högtalarna. Numera finns det dock ett antal olika system som innefattar lokaliseringssignaler som ITD, ILD och HRTF vilket möjliggör högre autenticitet.

När binauralt inspelat ljud ska återges korrekt måste tryckförändringarna vara detsamma vid öronen som vid mikrofonerna under inspelningen. Med hörlurar är detta inget problem, då högtalarna sitter där ljudet spelades in, men när binauralt inspelat ljud skall återges via två högtalare uppstår så kallad överhörning (crosstalk). Signalen från vänster högtalare når även höger öra och vice versa. De signaler som hjärnan använder för att bestämma källriktning förändras då så att ljudbilden förstörs i olika grad. Genom

signalbehandling, så kallad Crosstalk Cancellation, kan man återge binauralt inspelat ljud via två högtalare med autentiskt resultat. Något förenklat så innebär det att vänster

högtalare skickar ut den högra kanalens signal i negativ fas, filtrerat och fördröjt så att den högra högtalarens signal släcks vid vänstra örat och motsvarande för den högra högtalaren (se Figur 2 nedan).

(10)

Figur 2, Principiell funktion hos ett Crosstalk Cancellation System.

Det finns flera olika Crosstalk Cancellation system vilka använder olika signalbehandlingsalgoritmer. Väl konfigurerade system kan återge en fullgod tredimensionell ljudbild med bara två högtalare [Rum01].

Genom att återge det binauralt inspelade ljudet via högtalare går det att minimera front- back fel på grund av att metoden inte begränsar små huvudrörelser. Den största nackdelen med CCS är att lyssningspositionen blir förhållandevis liten. Om man flyttar för mycket på huvudet stämmer inte den algoritm, som släcker respektive kanal, överens med

öronens position och fel uppstår. En studie av Kirkeby, Nelson och Hamada [K+98] visar dock på intressanta resultat vid försök med att placera stereoparet tätare ihop än den sedvanliga 60º uppställningen. Studien visar att ju tätare ihop högtalarna placeras desto större och mer uniformt ljudfält skapas, vilket leder till mindre känslighet för

huvudrörelser. Dessutom kan ett interferensfel som uppstår skjutas upp i frekvens, från ca 2kHz till 10kHz, och minskas genom att föra ihop högtalarna till 10º.

Det har även gjorts försök att automatiskt avläsa huvudets position och kompensera crosstalkalgoritmen så att 3D-ljudbilden bibehålls [Gar97]. Att lyssningspositionen är så pass begränsad medför att antalet lyssnare kraftigt begränsas. Dessutom kan vissa lyssnare uppleva det vara utmattande att lyssna länge perioder på CCS [Rum01].

Enligt en rapport kan även en tredje högtalare mellan de två främre skapa en större lyssningsarea [YW00].

Används inte CCS tillsammans med högtalare kommer binauralt inspelat ljudmaterial inte kunna återges utan crosstalk-effekten. Det betyder att om man väljer att använda traditionell stereo med högtalare så kräver det annan inspelningsteknik. Detta kan göras på många olika sätt och kräver mer eller mindre manuell mixning i efterhand för att placera virtuella källor. Då traditionell stereo inte använder HRTFs så ger det således inte autentiskt 3D-ljud, men är det bara upplevelse som eftersträvas så kan traditionell stereo vara tillräcklig. Traditionell stereo möjliggör bara källokalisering mellan högtalarna men högtalaruppställningen har även kritiserats för att ha för stort avstånd mellan högtalarna vilket kan skapa hål i ljudbilden. Ökad upplevelse kan då fås genom att använda 5.1- system [Rum01].

(11)

2.3.2.2 Femkanalsystem och Ambisonics

Det mest spridda och använda multikanalsystemen för surroundljud som finns idag är 5.1, där 5 står för de fem högtalarna, tre fram, två bak och 1 står för LFE-kanalen (Low

Frequency Effects). Systemet bygger på ett traditionellt trekanalsystem med ett främre stereopar och en centerhögtalare. I 5.1-systemet skapar de tre främre högtalarna en traditionell 3-kanalsstereobild medan de två bakre högtalarna främst tar hand om

ambience-effekter som skapar ytterligare rumskänsla. Detta innebär att 5.1-system inte i första hand använts till äkta autentiskt 3D-ljud vilket förvisso går att åstadkomma med vidare signalbehandling. LFE-kanalen är en extra lågfrekvenskanal som återger ljudmaterial under 120Hz. Den är främst avsedd för specialeffekter som kräver högre ljudtryck och headroom än huvudkanalerna.

De nackdelar som finns med 5.1 är att de två främre högtalarna (L och R) sitter för tätt och därför skapar en för smal stereobild. Att de är placerade vid ± 30º beror på att systemet även ska kunna brukas för traditionell 2-kanalsstereo [Rum01]. Kritik mot 5.1- konfigurationen har också omfattat placeringen av de två bakre högtalarna mellan vilka det är hela 110 till 120 grader (se Figur 3 nedan). Surroundljud med 5.1 är inte tänkt att användas för äkta 3D-ljud utan främst tänkt för att användas till att höja upplevelsen för traditionell stereo. Surround kräver speciell inspelningsteknik av ljudmaterialet samt efterföljande mixning vilket bör anses som ytterligare en nackdel.

Figur 3, Standardiserad högtalaruppställning (5.1) enligt EBU Tech 3276.

Detta gör att de snarare kan uppfattas som sidohögtalare än bakre och ett hål kan uppstå i ljudbilden bakom lyssnaren [Rum01]. Det finns även en rad andra multikanalsystem som generellt sett adderat fler kanaler för att bredda stereobilden ytterligare, 7.1, 10.2 och så vidare vilka inte kommer behandlas inom detta arbete.

Det går dock att åstadkomma en bra 3D-ljudbild med 5.1-konfiguration genom att till exempel använda ett ambisonicssystem [Rum01]. Ambisonics är en mikrofon- och återgivningsteknik som omfattar hela ljudfältet i en punkt. Ljudet från alla tre

dimensioner spelas normalt in i en punkt med hjälp av en ljudfältsmikrofon vilken består

(12)

av tre 8-mikrofoner (fram-bak, vänster-högrer samt upp-ner). Vid ljudåtergivningen spelas de signaler upp med respektive högtalare där ljudet skulle uppfattas komma från på den reella inspelningsplatsen. Ljudmaterialet kan återges med en rad olika

högtalarkonfigurationer. Ambisonics används vanligast med 4, 6 eller 8 symmetriskt placerade högtalare men går även att använda med asymmetrisk högtalaruppställning så som 5.1 [PH05]. Desto fler högtalare som används desto större ljudfält skapas, vilket i sin tur tillåter fler lyssnare. En fördel med ambisonicsystemet är en relativt fri

högtalarplacering, så länge decodern vet var och hur många högtalare som ska användas återskapar den ljudfältet. En nackdel med systemet är de speciella krav på

inspelningsteknik som medföljer.

2.3.2.3 Fyrkanalsystem med CCS

För att få upplevelsen av att vara helt omsluten av ljud men ändå bibehålla autentiskt 3D- ljud som spelats in binauralt går det att använda fyra högtalare tillsammans med ett Crosstalk Cancellation system. Det finns metoder med fyra symmetriskt uppställda högtalare med 90º mellan varandra för detta ändamål. Det bygger på samma princip som gäller då två högtalare används tillsammans med ett Crosstalk Cancellation system. Då man adderar ett bakre par högtalare från vilka signalerna av de källor som upplevs komma bakifrån spelas upp fås bland annat färre front-back fel. Genom att använda två extra högtalare fås även en större lyssningsarea vilket möjliggör huvudrörelser inom en något större sfär [CS00].

2.3.2.4 Bashögtalare

Att använda bashögtalare (subwoofer) blir allt vanligare och dess uppgift är att återge de allra lägsta frekvenserna av ljudmaterialet. De flesta högtalarna som återger hela spektrat klarar sällan eller aldrig av att återge de lägsta frekvenserna starkt och tydligt. Genom att använda bashögtalare går det dessutom att spara plats då resterande högtalare slipper återge ljudet med lågt frekvensinnehåll vilket kräver större högtalarlåda.

Det finns ett flertal sanningar, och lika många myter, vad gäller placering och antal bashögtalare man ska använda för att få så jämnt rumssvar som möjligt.

Bashögtalare bör placeras med viss omsorg i ett lyssningsrum beroende på vilka moder som förväntas uppstå. Placeras bashögtalaren i ett hörn kommer alla moder i rummet att exciteras maximalt så vida det är frekvenser som högtalaren återger. Det beror på grund av att alla stående vågor har tryckmaximum i hörnposition. Detta skulle leda till ett ojämnt rumssvar. En studie [Wel02] visar att bäst frekvensrespons över en större

lyssningsarea fås genom att placera en bashögtalare i mittpunkten av varje vägg. Samma studie visar på att två bashögtalare intill väggen framför och bakom lyssningspositionen ger nästan lika bra resultat. Genom att placera bashögtalarna mitt emot varandra släcks de stående vågor som skapas i den axeln. Resultatet i rapporten har erhållits genom att beräkna rumssvaret över en större lyssningsarea för olika bashögtalarkonfigurationer.

En annan studie [Mar99] visar att två ej korrelerade bashögtalare ger en bredare spatial ljudbild jämfört med bara en bashögtalare vilket upplevs som ett mer levande ljud.

(13)

2.3.2.5 Kort sammanfattning av återgivningsmetoder

Beroende på vad som önskas uppnås med lyssningstestet kan olika återgivningsmetoder användas. Är inte målet att uppnå hög autenticitet och lokalisera små ljudkällor kan mindre exakta system användas. Man får även ha inspelningsteknik i åtanke när

återgivningsmetod ska väljas. Vissa metoder är mer krävande än andra och ger olika mått av autenticitet. En kort sammanfattning av de olika återgivningsmetoderna finns i Tabell 1 nedan.

Tabell 1, Sammanfattande tabell över för- och nackdelar hos respektive återgivningsmetod Återgivningsmetod Fördelar Nackdelar Hörlurar Använder HTRF Front-back fel

Inga krav på akustiken Fysisk påverkan

Många lyssnare

Hörlurar + Bashögtalare Känner basen i hela kroppen Vissa krav på akustiken Högtalare allmänt Befinner sig i ljudfältet Höga krav på akustiken

Ingen fysisk påverkan Färre front-back fel

Stereo Ingen HRTF

Hål i ljudbilden

Kräver mixning för källokalisering Stereo + CCS Använder HTRF Få lyssnare

Fyrkanal + CCS Använder HTRF

Större lyssningsarea

5.1 Surround Stor upplevelse Ingen HRTF

Flerkanalinspelning

Ambisonics Större ljudfält dvs möjlighet till fler lyssnare

Speciell inspelningsteknik

2.4 Akustik i lyssningsrummet

I detta kapitel kommer de egenskaper som påverkar rumsakustiken i ett lyssningsrum kort beskrivas. En dimensionsanalys för att få fram ett lyssningsrum anpassat efter EBU- standard genomfördes och dess resultat kommer att redovisas. Även resultatet från en dimensionering av absorbenter för att uppfylla EBU-standard kommer att redovisas. Ett ljud vars våglängd är 1,7 cm påverkas kraftigt av små hinder medan ett ljud med

våglängden 17 m inte påverkas alls. På grund av detta krävs det olika metoder, beroende på frekvens, för att analysera ljudfenomen. För låga frekvenser används den vågteoretiska rumsakustiken. För högre frekvenser används statistiska energimetoder samt geometrisk rumsakustik då ljudutbredningen kan liknas vid strålar.

2.4.1 Låga frekvenser

I detta stycke redovisas hur de låga frekvenserna påverkar akustiken i ett rum samt hur ett rum kan utformas för att tillgodose kraven som finns inom detta område.

(14)

I detta stycke redovisas de teorier som använts för att genomföra dimensioneringen av lyssningsrummet. De matematiska sambanden som analysen vilar på förklaras då dessa är vitala för förståelsen av rapporten i helhet.

2.4.1.1 Hur rumsmoder påverkar ljudbilden

Vid all ljudåtergivning i rum skapas stående vågor vid specifika frekvenser beroende på rummets dimensioner, frekvenserna som återges samt ljudkällans position. De stående vågorna skapar markanta skillnader i ljudtrycksnivå vilket kan färga upplevelsen av det återgivna ljudet.

Metoden med vilken det går att bestämma vid vilka frekvenser stående vågor uppstår bygger på vågekvationen och begränsas till enkla geometrier så som sfäriska,

parallellepipediska och cylindriska rum [H+01]. Metoden fordrar även att

begränsningsytorna i geometrin antas vara oändligt stela, det vill säga fullständigt reflekterande och partikelhastigheten vinkelrätt mot ytan är noll.

De stående vågorna skapas av positiv interferens mellan den infallande och reflekterade ljudvågen.

För plan vågutbredning i en tredimensionell värld gäller partikelhastigheten:

( )

r t pei( t kxx kyy kzz)

p r, = ˆ ω± ± ± , (1)

där minustecknet betecknar utbredning i koordinataxelns positiva riktning och plustecknet står för utbredning i negativ riktning. Insättning av ekvation (1) i vågekvationen;

1 0

2 2 2

2 =

− ∂

t

p

p c , (2)

ger att vågtalskomponenterna kx, ky och kz måste uppfylla villkoret

2 2 2

z y

x k k

c k k kr = =ω =

, (3)

Ur vågekvationen (2) kan partikelhastigheten för stående vågor under ovan nämnda randvillkor i x-led skrivas:

( ) ( )

x

( )

y

( )

z i t x

x k x k y k z e

i p k t r

u ω

ωρ sin cos cos ˆ

,

0

r = , (4)

där vågtalsvektorns komponenter blir kx = nxπ/lx för att partikelhastigheten, vid x = 0 och x = lx, ska vara lika med noll. För y- och z-led gäller således ky = nyπ/ly och kz = nzπ/lz. Insättning av vågtalskomponenterna i ekvation (3) ger tillsammans med sambandet

kc f =ω = π

2 följande formel för ett parallellepipediskt rums egenfrekvenser

(15)

( )

2 2 2

, 2

, ⎟⎟⎠

⎜⎜ ⎞

⎝ +⎛

⎟⎟

⎜⎜

⎝ +⎛

⎟⎟⎠

⎜⎜ ⎞

= ⎛

z z y

y x

x z

y

x l

n l

n l

c n n n n

f , (5)

där c är ljudets hastighet, nx, ny, nz är ordningstalet i respektive led och lx, ly, lz är geometrins längd i x-, y- och z-led.

Ordningstalet kan tänkas beskriva antalet halva våglängder för given frekvens i x-, y- och z-led. Den lägsta frekvens vid vilken det skapas en stående våg vid blir således c/2lx då ordningstalet nx = 1 och ny = nz = 0 där lx är det längsta dimensionen. Under denna

frekvens påverkas akustiken rummet endast av den tryckökning som skapas av den slutna volymen.

Stående vågor mellan två ytor (två av nx, ny, nz är noll) kallas axiella, mellan fyra ytor (en av nx, ny, nz är noll) kallas tangentiella och de stående vågor som skapas mellan alla sex ytor (nx, ny, nz är skiljda från noll) i en parallellepiped kallas oblika (sneda), se Figur 4 nedan

Figur 4, Frekvenserna för de stående axiella, tangentiella och oblika vågorna i ett rum.

I ett rum där ytorna inte kan betraktas som rigida kommer de axiella vågorna vara de kraftigaste på grund av att det bara blir absorptionsförlust vid två ytor jämfört med fyra för de tangentiella och sex för de oblika vågorna. De tangentiella vågorna innehåller bara hälften så mycket energi som de axiella och de oblika innehåller bara en fjärdedel så mycket energi vilket motsvarar -3dB respektive -6dB [Eve01]. Detta beror på att de tangentiella vågorna går mellan fyra väggar jämfört med två för de axiella och sex för de oblika. De tangentiella och oblika vågorna absorberas således vid fler ytor och förlorar mer energi.

Beroende på om två eller flera stående vågor vid samma frekvens ligger i eller ur fas förstärks eller dämpas rumssvaret. Inga andra frekvenser kan förekomma i ett rum än de som ljudkällan sänder. Återgivna frekvenser som exciterar en stående våg kan på grund

(16)

av sin bandbredd även excitera stående vågor med näraliggande frekvens. Hur starkt en stående våg exciteras beror på var källan befinner sig förhållande till vågens

ljudtrycksnod och buk.

I ett rum där en dimension är en multipel av en annan bildas flera stående vågor vid samma frekvens vilket leder till ett ojämnt rumssvar. Detta medför att rummets proportioner mellan höjd, längd och bredd är mycket viktigt att studera när ett jämnt rumssvar i de lägre frekvenserna önskas.

Inom den geometriska akustiken antas att diffust ljudfält råder, det innebär att den akustiska energin och spridningen är uniform i alla punkter och riktningar i rummet [ML68].

För att diffust ljudfält ska antas gälla i ett rum krävs hög moddensitet. Ju högre upp i frekvens desto tätare ligger de stående vågorna (se Figur 4 ovan), till slut kan ett diffust ljudfält antas råda då modernas fluktuationer jämnar ut varandra.

Kriterier

Här följer en kort beskrivning av de bedömningsgrunder som använts, för att skapa ett jämnt stående vågmönster och så hög moddensitet som möjligt.

Klassiska metoder och rumsproportioner

R.H. Bolt studerade medelavståndet mellan stående vågor med idén om att ett jämnt fördelat stående vågmönster resulterar i ett rakt rumssvar. Bolt menade att ett jämnt fördelat vågmönster ger mindre problem med toppar och dalar i rumssvaret. Senare har det visats att det ger bättre resultat att studera standardavvikelsen istället för medelvärdet.

På detta sätt tog Bolt fram ett stort antal rumsproportioner vilka ger ett förhållandevis diffust ljudfält. I en graf över den så kallade Bolt-arean kan man urskilja vilka dessa proportioner är (se Figur 5 nedan).

Figur 5, Bolt-arean, inom vilken ett jämnt rumssvar erhålls. [Eve01]

Det går dock att se att Bolt-arean innehåller tveksamma proportioner som 1:2 mellan höjd och längd, men överlag anses Bolt-arean påvisa relativt bra rumsproportioner.

Christopher Gilford angrep problemet med ett jämnt rumssvar vid låga frekvenser genom att anta en bandbredd på ca 20 Hz för de stående vågorna. Genom att notera var i

(17)

frekvens stående vågor uppstår går det sen att markera var multiplar och tomrum uppstår.

Gilford ansåg att ett tomrum på 20Hz ej får förekomma [Eve01].

M.M. Lauden jämförde och listade ett stort antal rumsproportioner genom att beräkna standardavvikelsen av modavståndet för att påvisa ett jämnt fördelat vågmönster.

Oscar J Bonellos anser att proportioner vilka ger ökande vågdensitet i det efterföljande tersbandet och inga multiplar, så vida tersbandet inte innehåller fem eller fler stående vågor, resulterar i ett jämnt rumssvar.

EBU om proportioner

För att någorlunda försäkra sig om en jämn fördelning av stående vågor har European Broadcasting Union i standard Tech. 3276 [EBU98] specificerat krav på rummets proportioner:

1.1w/h ≤ l/h ≤ 4.5w/h – 4

l < 3h w < 3h där

l = rummets längd (den större dimensionen av golvytan) w = rummets bredd (den mindre dimensionen av golvytan) h = rummets höjd.

Utöver dessa krav gället även att l, w och h vara skilt från ± 5 % av ett heltal, golvytan ska minst vara 40m2 och volymen får inte överstiga 300m3. Detta betyder till exempel att ett rum som är 10 x 5 x 2 meter inte skulle uppfylla kravet l < 3h då längden är större än tre gånger höjden.

2.4.1.2 Dimensionering av lyssningsrum

Standarder

Det finns flera standarder som behandlar hur ett rum för kvalitativ bedömning av små [ljud] skillnader ska se ut. De standarder som har använts inom detta arbete är

International Telecommunication Unions “Methods for the subjective assessment of small impairments in audio systems including multichannel sound systems” (ITU-R BS.1116-1) och European Broadcast Unions “Listening conditions for the assessment of sound

programme material: monophonic and two-channel stereophonic” (EBU Tech. 3276 2nd edition) samt tillägget för multikanalsljud (EBU Tech. 3276-E). Den standard som oftast används är ITU-R BS.1116-1 och EBU Tech. 3276 är i sin tur en utbyggnad av denna. På grund av detta så är de över lag väldigt lika men några skillnader finns, se Tabell 7. EBU- standarden har något hårdare krav och följdes därför vid dimensioneringen. Standarderna går inte in i detalj utan bidrar främst med ett ramverk att följa för att undvika akustiskt direkt undermåliga rum.

2.4.1.2.1 Dimensioneringsmetod

För att ge möjlighet att välja rumsstorlek utgick dimensioneringen från tre olika golvytor, alla väl inom EBU-standarden [EBU98], 45, 55 och 65m2. För att sedan hitta de bästa proportionerna mellan höjd, bredd och längd användes fem klassiska rumsproportioner

(18)

vilka tidigare visat ge goda resultat. Utöver det användes programvaran Room Sizer för att optimera fram ett förslag på rumsproportioner.

Tabell 2, Använda rumsproportioner samt ursprung.

Proportioner (h x b x l) Ursprung

1 x 1,419 x 2,012 Room Sizer 45m2 1 x 1,528 x 1,838 Room Sizer 55m2 1 x 1,53 x 1,848 Room Sizer 55m2 1 x 1,4 x 1,9 Lauden

1 x 1,28 x 1,54 Sepmeyer 1 x 1,6 x 2,33 Sepmeyer 1 x 1,26 x 1,59 Boner 1 x 1,5 x 2,5 Volkman

Detta gav följande de 18 rumsdimensionerna i Tabell 3 nedan att utvärdera.

Tabell 3, Utvärderade rumsdimensioner.

Golvyta

[m2] Höjd

[m] Bredd

[m] Längd

[m] Volym

[m3] Proportioner

[H x B x L] Ursprung 46 4,02 5,70 8,08 184,8 1 x 1,419 x 2,012 Room Sizer 45 4,11 5,76 7,81 185,1 1 x 1,4 x 1,9 Lauden 45 4,78 6,12 7,36 215,0 1 x 1,28 x 1,54 Sepmeyer 1 45 3,47 5,56 8,10 156,3 1 x 1,6 x 2,33 Sepmeyer 2 45 4,74 5,97 7,54 213,3 1 x 1,26 x 1,59 Boner 45 3,46 5,20 8,66 155,9 1 x 1,5 x 2,5 Volkman

55 4,42 6,75 8,12 242,0 1 x 1,528 x 1,838 Room Sizer 55 4,55 6,37 8,64 250,1 1 x 1,4 x 1,9 Lauden 55 5,28 6,76 8,13 290,5 1 x 1,28 x 1,54 Sepmeyer 1 55 3,84 6,15 8,95 211,3 1 x 1,6 x 2,33 Sepmeyer 2 55 5,24 6,60 8,33 288,2 1 x 1,26 x 1,59 Boner 55 3,83 5,74 9,57 210,6 1 x 1,5 x 2,5 Volkman

66 4,84 7,40 8,93 319,6 1 x 1,53 x 1,848 Room Sizer 65 4,94 6,92 9,39 321,3 1 x 1,4 x 1,9 Lauden 65 5,74 7,35 8,84 373,3 1 x 1,28 x 1,54 Sepmeyer 1 65 4,18 6,68 9,73 271,4 1 x 1,6 x 2,33 Sepmeyer 2 65 5,70 7,18 9,06 370,2 1 x 1,26 x 1,59 Boner 65 4,16 6,25 10,41 270,6 1 x 1,5 x 2,5 Volkman

Först sorterades de rum som inte följde EBU-standardens krav på volym, proportioner och nominal efterklang bort. Alla rumsdimensioner blev kvar förutom de fyra 65m2- rummen vars volym översteg 300m3. För att sedan bedöma och betygsätta de olika rumsdimensionerna användes ett antal kriterier.

(19)

Beräkning av stående vågor

Stående vågor för respektive rumsdimensioner beräknades enligt ekvation (5) upp till n = 25 för att försäkra att alla axiella vågor upp till 300Hz kom med i analysen.

För att kontrollera att Bonellos krav på ökad vågdensitet infrias plottades antalet vågor för varje tersband upp till 300 Hz, se Figur 6 nedan.

Figur 6, Exempeldiagram över ökande moddensitet per tersband.

Multiplar detekterades genom att beräkna differensen mellan en stående våg och nästkommande. Om skillnaden är mindre än 3Hz markeras en multipel. Även multiplar med tre stående vågor inom 4Hz detekterades (se Figur 7 nedan). Det antogs att en differens på tre och fyra hertz är rimligt för att de stående vågorna påverkar varandra på sådant sätt att de kan betraktas som multiplar. Betygsättningen av rumsdimensionernas multiplar utgick från Bonellos krav på att inga multiplar får förekomma i tersband som innehåller ≤5 stående vågor samt antalet multiplar med tre stående vågor inom 4Hz i det specifika intervallet.

(20)

Figur 7, Exempeldiagram över stående vågfrekvenser med markerade multiplar (streckad linje visar på två näraliggande vågor, heldragen linje visar på tre näraliggande vågor).

För att bedöma spridningen av stående vågfrekvenser beräknades standardavvikelsen enligt

1 )

( 2

= Σ

N x Mx

σ , (6)

där Mx är medelvärdet av differensen mellan de stående axiella vågorna inom givet intervall. N är antalet vågor och x är differensen.

Antalet differenser som låg utanför medeldifferensen± 0,5σ beräknades och användes slutligen för att bedöma spridningen av vågfrekvenserna.

Detta gjordes för hela intervallet 16-300Hz samt för intervallet 55-115Hz. Det senare intervallet studerades extra noga på grund av de kraftiga tonkomponenter av

hyttresonanserna som uppstår där, vilka inte bör förstärkas ytterligare av lyssningsrummets akustiska egenskaper.

Programvaran Room Sizer från RPG Inc. beräknar energiimpulssvaret vilket kan härledas ur vågekvationen. Fouriertransformationen av detta visar det relativa rumssvaret.

Mjukvaran beräknar automatiskt tusentals rumssvar med källa och mottagare i

hörnposition i rummet, vilket kan anses som ett totaltryck. Beroende på hur mycket det beräknade rumssvaret avviker från det ideala (rakt rumssvar, streckad linje i Figur 8) får varje rum ett betygsvärde vilket jämförs med tidigare beräknade rum. Detta värde användes för att bedöma rumssvarets jämnhet. Beräkningarna utfördes med samma absorptionsfaktor (α=0.2) på alla sex väggar. Absorptionsfaktorn på väggarna avgör hur spetsiga och höga nivåerna i rumssvaret blir. Exempeldiagrammet nedan är mest troligen ett rum med låg absorption på väggarna.

(21)

Figur 8, Exempel på beräknat rumssvar samt det ideala rumssvaret. (RPG Inc.)

Sammanställning med Pahl och Beitz problembehandlingsmetod För att ta hänsyn till samtliga kriterier och välja det bästa rummet utifrån alla dessa användes Pahl och Beitz metod [Ger96] för systematisk problembehandling. Utifrån problemformuleringen, hur ska ett rum dimensioneras för att ge så bra rumssvar i lyssningsposition som möjligt för det återgivna ljudet, fastställdes ovan nämnda kriterier som påverkande. Genom kriterieviktning enligt Pahl och Beitz metod bestäms hur betydelsefulla respektive kriterium är för att uppnå problemformuleringen. Genom att slutligen betygsätta alla rum efter deras resultat inom varje kriterium fås en slutpoäng vilken visar hur väl rummet enligt den specifika kriterieviktningen uppfyller

problemformuleringen. Betygskalan som användes gick från 1 till 5. Metoden möjliggör en enkel beslutsprocess för att välja mellan flera olika alternativ efter givna kriterium.

Metodens svaghet ligger i kriterieviktningen vilken oundvikligen blir mer eller mindre subjektiv. Sammanställningen visar enbart vilket det bästa rummet är efter den

kriterieviktning som genomförts, därför kan kriterieviktningen behöva göras om vid upprepning av dimensioneringen.

2.4.1.2.2 Resultat dimensionering

Resultatet av kriterieviktningen blev enligt Tabell 4 nedan.

(22)

Tabell 4, Resultat av kriterieviktning.

0,5 Hela Spektrat 0,22 jämn fördelning

0,19 hög moddensitet 0,11 minimalt antal tripplar 0,06 minimalt antal multiplar 0,31 ökande moddensitet

0,11 bra respons

0,5 Hyttintervall 0,20 jämn fördelning 0,16 hög moddensitet

0,32 minimalt antal tripplar 0,12 minimalt antal multiplar

0,20 bra respons

Resultatet av betygsättningen av respektive rumsdimensionern efter kriterieviktningen ovan blev enligt Tabell 5 nedan.

Tabell 5, Rumsdimensionerna och deras slutpoäng. Vinnande rum är markerade i fet stil.

Golvyta

[m2] Källa Höjd

[m] Längd

[m] Bredd

[m] Poäng

Room Sizer 4,02 5,70 8,08 2,91 Lauden 4,11 5,76 7,81 3,05 45 Sepmeyer 1 4,78 6,12 7,36 3,76

Sepmeyer 2 3,47 5,56 8,10 3,12 Boner 4,74 5,97 7,54 3,41 Volkman 3,46 5,20 8,66 2,53

Room Sizer 4,42 6,75 8,12 3,80 Lauden 4,55 6,37 8,64 3,48 55 Sepmeyer 1 5,28 6,76 8,13 3,81

Sepmeyer 2 3,84 6,15 8,95 3,59 Boner 5,24 6,60 8,33 3,55 Volkman 3,83 5,74 9,57 2,41

Room Sizer 4,84 7,40 8,93 3,86

Lauden 4,94 6,92 9,39 3,67 65 Sepmeyer 1 5,74 7,35 8,84 3,91

Sepmeyer 2 4,18 6,68 9,73 3,34

Boner 5,70 7,18 9,06 3,49 Volkman 4,16 6,25 10,41 2,07

Det är förhållandevis liten skillnad mellan rummen i poäng och poängen är starkt

beroende av den använda kriterieviktningen som genomförts mer eller mindre subjektivt.

Att Sepmeyer 2-rummet vinner i 65m2-klassen beror på att det bara har Volkman-rummet

(23)

att tävla emot då de övriga inte uppfyller EBU-standardens krav på en volym under 300m3. Dessa rum är markerade med kursiv stil.

2.4.1.3 Efterklangstid

Efterklang är effekten av alla de sena reflexer som når lyssnaren. I alla rum med reflekterande ytor byggs ett ljudtryck upp om en ljudkälla är närvarande.

Först nås lyssnaren av direktljudet och sedan av en rad reflektioner som bygger upp ljudtrycket ytterligare. Slås ljudkällan av minskar det uppbyggda ljudtrycket olika snabbt beroende på hur pass mycket ytorna i rummet absorberar ljud vid respektive frekvens.

Hur snabbt avklingningen sker i ett rum kallas för efterklangstid.

Efterklangstid är ett gammalt sätt att beskriva ett rums akustiska egenskaper. Redan omkring år 1900 fann W.C. Sabine empiriskt formeln för efterklangstiden i ett rum.

Förenklat beskriver efterklangstiden hur snabbt ljudet i ett rum dör ut. Efterklangstid mäts och beräknas oftast i oktavband då den är frekvensberoende och definieras som den tid det tar för ljudet att sjunka 60dB.

Stående vågor påverkar efterklangsfältet.

Vid uppmätning av efterklang kan ibland dubbla avklingningar uppfattas (se Figur 9 nedan). Första avklingningen kan till exempel visa på en efterklangstid på 0,34 sekunder medan den andra visar på en efterklangstid på 0,55 sekunder.

Figur 9, Uppmätt efterklangstid, dubbel avklingning. [Eve01]

Detta är ett tecken på att ett icke diffust ljudfält råder vilket kan bero på att flera stående vågor tillåts klinga av utan att absorberas tillräckligt. Högre upp i frekvens ligger de stående vågorna så pass tätt att deras effekt jämnas ut, det vill säga att det närmar sig ett diffust ljudfält. Detta gör också att avklingningen blir jämnare. Detta är ännu ett skäl för att hög moddensitet är önskvärt även vid låga frekvenser.

I ett rum där man ska bedöma små ljudskillnader krävs att efterklangstiden begränsas relativt kraftigt, även om lång efterklangstid kan ge ytterligare rumskänsla, så som i en kyrka, så har det negativa effekter på till exempel förmågan att uppfatta transienter och andra nyanser i ljudet. Snabba korta ljud som transienter kan maskeras om

efterklangstiden är för lång och då går lyssnaren miste om den informationen. På grund

(24)

av detta har efterklangstiden för kritiska lyssningsrum beroende på volym slagits fast i bland annat EBU Tech. 3276 enligt Figur 10 nedan

Figur 10, Tillåten avvikelse i sekunder över hela frekvensområdet relativt en nominell efterklangstid.

[EBU98]

där Tm, som ska ligga mellan 0,2 < Tm < 0,4 sekunder, är den nominala efterklangstiden beräknad enligt

V s Tm V

3 1

0

25 ,

0 ⎟⎟

⎜⎜ ⎞

= ⎛ , (7)

där V är volymen och V0 är referensvolym på 100m3.

2.4.1.4 Absorption och diffusion

Lagen om energins bevarande säger att energin varken kan skapas eller förstöras, bara omvandlas. När en ljudvåg träffar en skiljeyta mellan två olika medium sker en reflektion av vågenergi samt att en del av energin transmitteras in i det nya mediet. Hur mycket energi som reflekteras och transmitteras beror på ljudvågens infallsvinkel och mediets egenskaper. Beroende på hur pass mycket energi som transmitteras in i mediet desto mindre energi reflekteras tillbaka. Att absorbera höga frekvenser med kort våglängd är både lätt och billigt, men vad gäller absorption av låga frekvenser är det mer komplicerat.

I kritiska lyssningsrum där efterklangen är relativt kort krävs effektiva

lågfrekvensabsorbenter. Vanligtvis används en kombination mellan perforerade väggar, membran-, Helmholtz- och porösa absorbenter. Placeringen av dessa är viktig, generellt måste till exempel porösa absorbenter placeras där partikelhastigheten är störst, det vill säga vid λ/4. Detta leder till att lågfrekvensabsorbenter tar mycket stor plats då till

exempel λ/4 för 100Hz blir 88 centimeter. Genom att placera porösa absorbenter i hörnen där ljudtrycket från stående vågor är maximalt fås stor effekt. Lågfrekvensabsorption kan också ske i taket, till exempel så kan man över ett akustiskt genomskinligt undertak med fördel placera stora lågfrekvensabsorbenter. Exempel på olika lågfrekvensabsorbenter och deras absorptionsvärden finns i Tabell 6 nedan.

(25)

Tabell 6, Absorptionskoefficienter för diverse lågfrekvensabsorbenter

Material 125Hz 250Hz 500Hz 1kHz 2kHz 4kHz RPG Inc. Modex Corner™ 0,54 0,36 0,21 0,26 0,32 0,46

Perf1: 0.18% 0,40 0,70 0,30 0,12 0,10 0,05 Perf1: 0.79% 0,40 0,84 0,40 0,16 0,14 0,12 Perf1: 8.7% 0,27 0,84 0,96 0,36 0,32 0,26 Perf2: 0.18% 0,80 0,58 0,27 0,14 0,12 0,10 Perf2: 0.79% 0,98 0,88 0,52 0,21 0,16 0,14 Perf2: 8.7% 0,78 0,98 0,95 0,53 0,32 0,27 Ecophon Master A + Master

Extra Bass (tak) 0,85 0,95 0,95 1,00 1,00 0,95 Ecophon Master A alpha (tak) 0,45 0,90 0,95 1,00 0,95 0,90 Perf1, Perforerad panel, 5/32" tjock, 4" djup, 2" glasfiber

Perf2, Perforerad panel, 8" djup, 4" glasfiber

Absorption vid låga frekvenser är dock svårt att beräkna på grund av att diffust ljudfält måste antas gälla vilket det sällan eller aldrig gör. Därför är det tvunget att mäta upp efterklang och rumssvar efter att lyssningsrummet byggts för att identifiera

problemfrekvenser och sedan välja lämplig absorptionsmetod.

2.4.1.5 Diffusion

Diffusion, eller spridning, av ljudenergi i ett rum är viktig på grund av de fördelar som finns då ett diffust ljudfält råder. Ett perfekt diffust ljudfält leder bland annat till jämn efterklangstid för hela rummet. Mellan två hårda parallella ytor finns möjligheten att fladder-eko kan uppstå. Fladder-eko uppstår på grund av upprepade reflektioner mellan ytorna vilket kan alstra negativa färgningar av timbre och pitch. Detta problem kan antingen lösas genom att placera absorberande eller diffuserande material där reflektionerna sker.

Diffusorer fungerar genom diffraktion, mest effektiv diffraktion uppstår när ljudvågen bryts vid λ/4. Detta medför att diffusering av låga frekvenser är svårt utan främst fungerar för höga frekvenser.

2.4.2 Höga frekvenser

Vid all ljudåtergivning med högtalare fås reflexer från väggar, tak och golv, såvida återgivningen inte sker i ett ekofritt rum. Dessa reflexer är mycket viktiga att studera och kontrollera då de kan ge upphov till en rad problem, till exempel sämre

lokaliseringsförmåga.

För höga frekvenser där våglängden är liten jämfört med rummets dimensioner används geometriskt akustisk modell för att beskriva de fenomen som uppstår. Inom den

geometriska akustiken beskrivs ljudvågor som strålar vilket möjliggör att vägen ljudet tar från källan till mottagaren kan spåras. På detta sätt är det möjligt att modellera upp lyssningsrum och sätta in källor samt mottagare för att analysera var absorbenter alternativt diffusorer bör placeras. Dimensionering av absorbenter är på samma gång möjligt.

(26)

2.4.2.1 Tidiga reflektioners påverkan på ljudbilden

I ett lyssningsrum nås lyssnaren först av direktljudet från källan och sedan av en rad reflektioner från golv, väggar och tak, se Figur 11 nedan. Det tidigast ankommande ljudet (direktljudet) ges dock företräde över senare ankommande ljud (reflexer) vid lokalisering av ljudkällan enligt Haas-effekten [Eve01].

Figur 11, (a) och (b), Direktljud och tidigt ankommande reflektioner.

Förmågan att lokalisera en ljudkälla kan påverkas negativt om många starka tidiga

reflexer finns i rummet. På grund av hjärnans förmåga att integrera det reflekterade ljudet över ca 35 millisekunder, upplevs sällan de tidiga reflexerna som ett eko, utan de

uppfattas snarare som färgat ljud- och spatial effekt. Något senare ankommande reflexer påverkar i sin tur främst rumskänslan (spaciousness) [Rum01]. För att en reflex ska tolkas som ett diskret eko krävs det att den är relativt stark jämfört med direktljudet, se Figur 12 nedan.

(27)

Figur 12, Upplevelse av reflexioner beroende på styrka och ankomsttid. [Eve01]

Ett annat problem som kan uppstå med tidiga reflexer är kamfiltereffekten.

Kamfiltereffekt uppstår när mottagaren av ett kontinuerligt ljud nås av tidiga reflektioner kort efter direktljudet. Där vägskillnaden mellan direktljudet och det reflekterade ljudet överensstämmer med nλ/2 meter, där n=1,2,3.., uppstår en utsläckning eftersom fasskillnaden blir 90º vilket ger upphov till destruktiv interferens. På samma sätt skapas en förstärkning, till följd av superpositionsprincipen, där fasskillnaden är 180º, det vill säga en vägskillnad på nλ meter, för n=1,2,3... Vissa frekvenser förstärks medan andra släcks ut vilket ger uppenbar negativ påverkan på rumssvaret i lyssningsposition.

Ett kamfilter där tidsskillnaden mellan direktljudet och det reflekterade ljudet är långt uppfattas inte lika tydligt som ett kamfilter med kort försening eftersom att örats kritiska bandbredd då är så pass grovt i jämförelse till kamfiltrets rippel [Eve01]. Dessa problem går alla att undvika genom att skapa en så kallad reflektionsfri zon. Reflektionsfri zon innebär att alla tidiga reflexer dämpas eller speglas bort från lyssningspositionen.

2.4.2.2 Absorptionskrav beroende av återgivningsmetod

För att undvika ovan nämnda fel och färgningar som kan uppstå på grund av reflexer i ett rum krävs att absorbenter placeras ut omsorgsfullt. Utöver dämpningen av reflexer krävs absorbenter, i ett rum för ljudåtergivning med högtalare, till att kontrollera

efterklangstiden. För att ge exempel på hur en absorptionsdimensionering som uppnår de krav som ställs på efterklang och dämpning av tidiga reflexer i ett lyssningsrum för hörlurar och bashögtalare respektive högtalare kan se ut, genomfördes en enkel dimensionering för ett rum med måtten 7,36 x 6,12 x 4,78 meter (Sepmeyer1, 45m2 golvarea).

(28)

2.4.2.2.1 Absorptionskrav för hörlurar plus bashögtalare

Det finns i princip inga krav på absorption i ett rum där lyssning ska ske med enbart hörlurar, det är dock rekommenderat att införa normal jämn absorption så att till exempel taltydligheten blir acceptabel. Så fort en högtalare introduceras i rummet bör

absorptionen/efterklangstiden studeras för det frekvensspektrum högtalaren förväntas återge. Används en bashögtalare bör efterklangskraven enligt EBU-standard efterföljas minst i det frekvensspektrum den ska återge. De enda krav som finns på ett lyssningsrum för återgivning enbart med hörlurar är kravet på bakgrundsnivå i ITU-R BS.1116-1, det vill säga samma krav som för ett rum med högtalare (se Figur 13 och Tabell 7 nedan).

0 10 20 30 40 50 60 70

10 100 1000 10000

Frekvens

dB

NR10 NR15

Figur 13, Föreslagna Noise Rating-kurvor att efterfölja enligt EBU/ITU.

2.4.2.2.2 Absorptionskrav högtalarrum

Det ställs höga krav på ett rum för ljudåtergivning med högtalare vad gäller placering och dimensionering av absorbenter än ett rum för enkom hörlurar. Detta beror på att ett antal tidiga reflexer måste dämpas och kravet på efterklangstiden gäller hela frekvensspektret.

Till följd av de tidiga reflexernas inverkan på ljudbilden (se 2.4.2.1) föreslås det, i de flesta standarder för utformning av lokaler avsedda för kritisk bedömning, att dessa skall kontrolleras noga. I både International Telecommunication Union och European

Broadcasting Unions standarder, som använts i detta examensarbete, anges att alla reflexer som når lyssnaren inom 15 millisekunder efter direktljudet skall vara dämpade 10dB (se Tabell 7). Oavsett antalet högtalare och placeringen av dessa bör tidiga reflexer kontrolleras noga.

(29)

Tabell 7, Grundläggande krav enligt ITU och EBU.

ITU-R BS.1116-1 EBU Tech. 3276 Grund IEC 60268-13 ITU-R BS.1116-1 Golvyta 1-2 kanaler: 20-60m2 >40m2

Multikanal: 30-70m2

Volym <300m3

Proportioner 1.1 (w/h) (l/h) (4.5 (w/h)-4) 1.1 (w/h) (l/h) (4.5 (w/h)-4) l/h < 3 l/h < 3

w/h < 3 w/h < 3

RT60 Tm = 0.25 (V/V0)1/3 ± 0.05s Tm = 0.25 (V/V0)1/3 ± 0.05s

(0.2 - 4kHz) (0.2 – 4kHz) tillåter 0.1s ökning >4kHz

Rumssvar ±3dB ±3dB

1.5dB/oktav minskning >2kHz 1dB/oktav minskning >2kHz 2dB/oktav minskning <200Hz

Reflektioner -10dB (<15ms, 1-8kHz) -10dB (<15ms, 1-8kHz) Bakgrundsnivå NR10, max NR15 NR10, max NR15

Antal lyssnare 1-7

En graf som visar styrkan hos direktljudet och hur de tidiga reflexerna bör se ut enligt Figur 14 nedan

Figur 14, Typiskt utseende över tidigt ankommande reflektioner till ett (a) absorptionsbehandlat rum samt (b) ett ej absorptionsbehandlat rum.

Symmetri är viktigt i lyssningsrummet då högtalarna på respektive sida bör ge upphov till så likt rumssvar som möjligt i lyssningsposition(erna). Detta medför att varje yta, med specifik absorption, bör finnas speglad på motstående vägg i rummet med en yta med liknande absorptionsfaktor. Detta leder till exempel till att ett eventuellt fönster in till ett kontrollrum bör, om möjlighet finns, placeras där inga tidiga reflexer mellan högtalare och lyssnare träffar då glas sällan har tillräcklig absorptionsfaktor att dämpa höga frekvenser mer än 10dB. Ett alternativ till en glasruta för att observera lyssningstest är installation av videokameror vilket inte påverkar rumsakustiken.

(30)

2.4.2.2.3 Absorptionsdimensionering – Hörlurar och bashögtalare

Dimensioneringen av absorbenter enligt EBU-standard och dess placering i rummet som är avsett för hörlurar och bashögtalare, gjordes bara upp till 250Hz-bandet då enbart frekvenser upp till cirka 200-300Hz kommer att återges av bashögtalarna. Rummet dimensionerades med väggar av plywood och perforerad panel. Till taket användes Ecophon Master™ A alpha + Master Bass (se Bilaga 1, Echophon Master A,

ljudabsorptionsfaktor.). För att ytterligare absorption av de lägsta frekvenserna användes fyra stycken hörnabsorbenter, Modex Corner (se Bilaga 2, RPG Inc. Modex Corner, absorptionsfaktor.) från RPG Diffusor Systems, en placerad i varje hörn.

Resultatet av absorptionsdimensioneringen för ovan nämnda rum då enbart bashögtalare skall användas blev enligt Tabell 8 nedan.

Tabell 8, Resultat av absorptionsdimensionering.

Material Area 125Hz 250Hz

α Sa α Sa

Plywood 141,84 28% 39,72 22% 31,20 Perforerad panel 30 98% 29,40 88% 26,40 MasterABass 45,04 85% 38,29 95% 42,79 ModexCorner 1,44 54% 0,78 36% 0,52

Medelabsorption 0,50 0,47

RT60 0,32 0,35

Tm (EBU) 0,32 0,32

T-Tm 0,00 0,03

Efterklangstiden (RT60) faller väl inom de gränsvärden som fastställts av EBU (se Tabell 7). Beräkningarna är gjorda med Sabines (Sa), ekvation 8 nedan, och bör därför tas med en nypa salt då denna metod inte ger tillförlitliga resultat då medelabsorptionen är större än 0,3. Resultatet ger dock en viss indikation på vilken absorptions som krävs. För att Sabines formel ska gälla krävs dessutom ett rum med jämnt fördelad absorption, vilket inte kan anses gälla i detta rum. Metoden ställer samtidigt krav på att ljudfältet kan anses vara diffust vilket är svårt att uppnå för låga frekvenser. Att Sabines formel trots det använts beror bland annat på att tillverkare av absorptionsmaterial bara tillhandahåller uppmätta α-värden beräknade efter Sabines metoder.

2.4.2.2.4 Absorptionsdimensionering – Högtalare

För att uppnå de krav på tidiga reflexer som ställs i ITU och EBU-standarderna och uppnå en graf liknande den Figur 14(a) krävs alltså att absorbenter noggrant placeras på väggar, golv och tak där reflektion från ljudkällan sker och sedan når mottagaren inom 15 millisekunder från det att direktljudet anlänt, se Bilaga 4, Identifiering av tidig reflex i CATT-Acoustic. Dessa absorbenter måste dessutom dimensioneras så att tillräcklig absorption sker mellan 1-8 kHz för att dämpa de reflekterade ljudvågorna 10 dB. Detta kräver en absorptionsfaktor α på cirka

References

Related documents

Liknande har Änggård (2012) skrivit i sin studie om naturmiljöns viktiga aspekter för barns kommunikation och samspel där förklarar hon att barn använder sig av den fysiska miljön

Diskrimineringsombudsmannen (DO) har anmodats att yttra sig över promemorian Kompletterande bestämmelser till utträdesavtalet mellan Förenade kungariket och EU i fråga om

Vidare ska det tydligt framgå hur lätt och snabbt Configura är att lära sig och använda samt hur detta underlättar för både säljaren och kunden vid säljprocessen.. Säljaren

Denna uppsats skulle författas på avancerad nivå under 20 veckor. För att nå en avancerad nivå och ett tillräckligt djup under denna korta tidsram gjordes studien relativt smal med

På detta utdrag från detaljplanen för västra angöringen vid Lunds C finns särskilt angiven cykelparkering ”cykelp” både på allmän plats (parkmark) och

Uppsiktsansvaret innebär att Boverket ska skaffa sig överblick över hur kommunerna och länsstyrelserna arbetar med och tar sitt ansvar för planering, tillståndsgivning och tillsyn

När nya lösningar krävs inför ett nytt DLL-projekt så utvecklas de inom ramen för detta projekt, men tas sedan över av konceptägaren så att lösningarna lever vidare för

Online registration is possible on the official Conference website www.eurocat2013.com. or contact Conference agency: