Fyrkanaligt surroundljud med två eller tre mikrofoner

(1)

tve10005juni

Examensarbete 15 hp

juni

Fyrkanaligt surroundljud med

två eller tre mikrofoner

Jan Westermark

(2)

Teknisk- naturvetenskaplig fakultet UTH-enheten Besöksadress: Ångströmlaboratoriet Lägerhyddsvägen 1 Hus 4, Plan 0 Postadress: Box 536 751 21 Uppsala Telefon: 018 – 471 30 03 Telefax: 018 – 471 30 00 Hemsida: http://www.teknat.uu.se/student

Abstract

Fyrkanaligt surroundljud med två eller tre mikrofoner

Four channel surround sound with two or three

microphones

Jan Westermark

Syftet med denna empiriska studie var att undersöka, utveckla samt verifiera matris/mixer till

en prototyp för 4.0 surroundljud med två alternativt tre kondensatormikrofoner. För att

undersöka detta har en mixer/matris konstruerats och byggts. För att verifiera mixern/matrisen

har ett blindtest utförts. Resultatet av undersökningen visade att metoden fungerar med tre

mikrofoner, däremot inte med två mikrofoner.

ISSN: 1401-5757, tve10005juni Examinator: Urban Lundin

(3)

Uppsala Universitet Teknisk fysik

Självständigt arbete i teknisk fysik, 15hp 2010-06-03

Fyrkanaligt surroundljud med två eller tre mikrofoner

Författare: Jan Westermark Handledare: Tomas Westermark

(4)

Sammanfattning

Syftet med denna empiriska studie var att undersöka, utveckla samt verifiera matris/mixer till en prototyp för 4.0 surroundljud med två alternativt tre kondensatormikrofoner. För att

(5)

Innehållsförteckning

1. Inledning ………1 2. Bakgrund………1 2.1 Mid Side-teknologin …….………...1 3. Syfte …...………3 4. Teori....………3 4.1 Teori för två mikrofoner………...3

4.2 Teori för tre mikrofoner………5

5. Metod och tillvägagångssätt………...7

6. Resultat………...8

6.1 Resultat, två mikrofoner………...8

6.2 Resultat, tre mikrofoner………8

7. Diskussion………..8

7.1 Resultatdiskussion………8

7.2 Metoddiskussion………...9

7.3 Slutsatser………...9

7.4 Förslag till fortsatt forskning ………....9

8. Referenser...10

(6)

1

1. Inledning

Sedan urminnes tider har musik varit viktig för människan och sedan mer än ett sekel har det funnits möjlighet att reproducera musik, vilket också skett i ständigt ökande omfattning. Olika tekniska lösningar har passerat revy, allt från vaxrullar till de olika digitala medier som idag används. Mångfaldigande och distribution har samtidigt i hög grad förenklats. Vem som helst kan lyssna på vad som helst när som helst. Varje inspelningstillfälle innebär ett försök att fånga det akustiska skeendet i varje ögonblick för att sedan kunna spela upp det hela när så önskas.

I min familj finns sedan flera generationer intresse för musik, både som utövande musiker och nu senare som musiktekniker. Då både med konstruktion av utrustning och inspelningsverksamhet. I och med detta har diskussioner om musik och ljud samt där tillhörande experiment varit vanligt förekommande. Utifrån diskussioner, främst med min far, har flera möjliga projekt växt fram. Ett av dessa är att undersöka möjligheten att i första hand med två mikrofoner och i andra hand med tre mikrofoner kunna få fram ett fyrkanaligt surroundljud, vilket också är syftet med denna studie.

2. Bakgrund

2.1. Mid Side-teknologin

Mid Side-teknologin, nedan kallad MS-teknologin, är ett av många sätt att försöka återskapa en tvåkanalig ljudmiljö. Enligt Alexander, (1999), uppfanns inspelningstekniken år 1931 av den mycket framstående engelske ingenjören Alan Dover Blumlein (29 juni 1903 – 7 juni 1942) då han och hans fru besökte en lokal biograf. Blumlein upptäckte där att när en pratande skådespelare rörde sig från ena sidan av filmduken till den andra följde talet inte med bilden. Detta berodde på att talet alltid var upptaget i mono och spelades upp i en högtalare. Detta medför till exempel att en

skådespelare som befinner sig på den högra sidan av filmduken, kan uppfattas som kommandes från den vänstra sidan av filmduken beroende på var åskådaren befinner sig. Blumlein konstaterade då till sin fru att han hade en lösning på detta vilken skulle medföra att om en skådespelare rör sig från ena sidan av filmduken till den andra kommer rösten att följa bilden, den numera kända MS-teknologin.

MS-teknologin går enligt Blumlein, (1931) och Boré, (1956) ut på att med två mikrofoner, en benämnd M (mid) oftast med ”cardioidkaraktäristik” (figur 1) samt en benämnd S (side) med ”åttakaraktäristik” (figur 1) kunna avbilda ett akustiskt skeende. (Karakteristikerna förklaras i Appendix).

I det reproducerade akustiska skeendet skall det gå att placera ut var i rummet de olika ljudkällorna befinner sig. En faktor vid inspelningstillfället är att rummets förutsättningar inkluderas, det vill säga att rummets akustik, och rummets akustik i förhållande inre och yttre ljud. Exempel:

Inspelning av konversation på ett café vid tågstation. Fokus är en konversation. Inre bakgrundsljud; slammer från porslin, prat, skratt, pling i dörren. Yttre bakgrundsljud som tränger in i lokalen; dörren öppnas, tåg, tåggnissel, trafik, kyrkklocka.

För att genomföra detta placeras M-mikrofonen riktad mot ljudkällan, konversationen.

(7)

2

Figur 1. Figuren visar hur de två mikrofonernas riktningskarakteristiker kan vara placerade gentemot en given ljudkälla för en MS konfiguration.

Figur 2. Figuren visar hur de två högtalarna kan placeras i rummet.

(8)

3 Följande ekvationer erhålls:

1. V = M + kS 2. H = M – kS

där k anger hur mycket S-signal som används i slutmixen. Samt randvillkoret

3. │M│ > │kS│

Ekvation ett och två visar hur signalen skall mixas för att respektive högtalare skall få rätt signal, randvillkoret (3) visar att om │kS│ är större än │M│ resulterar detta i ekvationen:

4. V = – H

Ekvation fyra visar att då randvillkoret inte är uppfyllt kommer ljudet i högtalarna att uppfattas som om de är kopplade i motfas. Förutsatt att de båda högtalarna är identiska. Det vill säga när

högtalarmembranet i vänster högtalare (V) ges en signal som gör att högtalarmembranet rör sig i en riktning kommer högtalarmembranet i höger högtalare (H) att röra sig lika mycket fast åt precis motsatt håll.

Då M- och S-mikrofonerna ger två diskreta monosignaler ända tills matrisering/mixning genomförs, går det att först lagra informationen som separata monosignaler. Detta medför att den slutgiltiga mixen inte behöver göras vid inspelningstillfället utan kan göras senare. k varieras för att ändra stereobredden. Då k=0 finns endast en monosignal.

3. Syfte

Syftet med denna empiriska studie är att undersöka, utveckla samt verifiera matris/mixer till en prototyp för 4.0 surroundljud med två alternativt tre kondensatormikrofoner.

4. Teori

Blumleins teori om MS-teknologin har används som utgångspunkt för nedan presenterade ekvationer med tillhörande randvillkor (5-19).

För att kunna få ett fyrkanaligt surroundljud för ett givet inspelningsscenario där målet med inspelningen är att både erhålla riktning samt få med hela ”rummet”.

4.1 Teori för två mikrofoner

(9)

4

Figur 3. Figuren visar hur de två mikrofonernas riktningskaraktäristiker är placerade gentemot två givna ljudkällor.

(10)

5 Ekvationer med tillhörande randvillkor:

5. V_F = S_1 + kS_2 6. H_F = S_1 – kS_2 7. V_B = – S_1 + kS_2 8. H_B = – S_1 – kS_2 9. │S_1│ > │kS_2│

Ekvation fem till och med åtta visar hur signalen skall matriseras/mixas för att respektive högtalare skall få rätt signal, k visar hur mycket S_2-signal som mixats ut till högtalarna, randvillkoret nio visar att om │kS_2│ är större än │S_1│ resulterar detta till ekvationen:

10. V_F = – H_F 11. V_B = – H_B

Ekvation tio och elva visar att då randvillkoren inte är uppfyllda kommer högtalarna upplevas som om de är kopplade i motfas. Det vill säga när till exempel högtalarmembranet i vänster

framhögtalare (V_F) får en signal som gör att högtalarmembranet rör sig i en riktning kommer högtalarmembranet i höger framhögtalare (H_F) att röra sig lika mycket fast åt precis motsatt håll, förutsatt att de båda högtalarna är exakt lika.

4.2 Teori för tre mikrofoner

För att göra detta används tre mikrofoner, två stycken med ”cardioidkaraktäristik” nedan kallade M_F och M_B samt en mikrofon med ”åttakaraktäristik” nedan kallad S (figur 5) samt fyra högtalare (figur 6).

(11)

6

Figur 6. Figuren visar hur de fyra högtalarna kan placeras i rummet.

Ekvationer med tillhörande randvillkor: 12. V_F = M_F + kS 13. H_F = M_F – kS 14. V_B = – M_B + kS 15. H_B = – M_B – kS 16. │M_F│ > │kS│ 17. │M_B│ > │kS│

Ekvation 12 till och med 15 visar hur signalen skall matriseras/mixas för att respektive högtalare skall få rätt signal, k visar hur mycket S-signal som mixats ut till högtalarna, randvillkoren 16 och 17 visar att om │kS│ är större än │M_F│ och eller │M_B│ resulterar detta i ekvationerna:

18. V_F = – H_F 19. V_B = – H_B

Ekvation 18 och 19 visar att då randvillkoren inte är uppfyllda kommer högtalarna upplevas som om de är kopplade i motfas. Det vill säga när till exempel högtalarmembranet i vänster

(12)

7

5. Metod och tillvägagångssätt

För att kunna pröva teorin kommer ett flertal kretsar samt även upphängningsanordningar för de två/tre mikrofonerna att konstrueras och byggas upp i enlighet med ekvationerna (5-19) samt figurerna tre och fem (figur 7-8).

Figur 7. Figuren visar blockschema för matris/mixer vid teoriprövning av två mikrofoner, beteckningar enligt ekvationerna (5-8).

Figur 8. Figuren visar blockschema för matris/mixer vid teoriprövning av tre mikrofoner, beteckningar enligt ekvationerna (12-15).

För att därefter kunna pröva konstruktionerna kommer ett blindtest att genomföras. Blindtestet utförs först med två mikrofoner och därefter med tre mikrofoner.

(13)

8

6. Resultat

6.1 Resultat, två mikrofoner

Resultatet vid genomförandet av blindtestet med två mikrofoner är att det inte fungerar. Det går inte att avgöra om en ljudkälla befinner sig framför eller bakom testperson B. Resultatet är detsamma med testperson A. När högtalarna framför testpersonen stängs av, går det att bedöma om ljudet kommer från vänster eller från höger. När högtalarna bakom testpersonen stängs av, går det att bedöma om ljudet kommer från vänster eller från höger. Då samtliga fyra högtalare är påslagna går det för testpersonen att i någon mån avgöra om ljudet kommer från vänster eller höger sida.

6.2 Resultat, tre mikrofoner

Resultatet vid genomförandet av blindtestet med tre mikrofoner är att teorin fungerar. Resultatet är samma för båda testpersonerna. Det går att avgöra i vilken kvadrant ljudkällan upplevs befinna sig. Då värdet på k är lågt är det svårare att bedöma i vilken kvadrant ljudkällan befinner sig. Då värdet på k är högt är det svårare att bedöma i vilken kvadrant ljudkällan befinner sig. Testpersonerna upplever att ljudet är överallt i rummet.

7. Diskussion

7.1 Resultatdiskussion

Vid teoriprövningen har följande utrustning används: 2 st. KM74 (se Appendix figur 1 och 2) som M-mikrofoner och en U77 (se Appendix figur 3 och 4) som S-mikrofon, samtliga mikrofoner är av fabrikatet Neumann. 4 st. full range elektrostathögtalare, Quad ESL-57 med tillhörande

förförstärkare och slutsteg. Matris/mixer.

Jag har via empiriska studier funnit att valet av min utrustning överensstämmer med studiens syfte. Delar av utrustningen som till exempel matrisen/mixern har jag tillverkat själv. Komponenterna i matrisen/mixern är empiriskt utprovade. Detta innebär att valet av utrustning kan ha påverkat resultatet. Utrustningen har valts med målsättning att undvika förvrängningar av ljudet/talet eftersom målet har varit att avbilda ett scenario.

Tekniken är ännu inte testad i ett ”skarpt” inspelningstillfälle, vilket försvårar bedömningen av teknikens framtidsutsikter. Omkonstruktion av matrisen/mixern kan behövas, beroende på

inspelningstillfälle. Detta för att kunna ändra specifika inställningar i matrisen/mixern. Om behov uppstår är det förmodligen relativt enkelt att korrigera.

7.1.1. Resultat två mikrofoner

Resultatet överensstämde inte med syftet. Vid testet konstaterades att det inte gick att avgöra om försöksperson A befann sig framför eller bakom försöksperson B. Orsaker till detta skulle kunna vara att matrisering/mixningen som gjordes var fel approach till problemet. Det kan också bero på att antalet dimensioner/riktningar är för få för att kunna bedöma i vilken kvadrant försöksperson A befinner sig.

7.1.2. Resultat tre mikrofoner

(14)

9

7.2 Metoddiskussion

Jag har valt att utgå från MS-teknologin. Denna teknik är troligen den enda kända inspelningsteknik där information om var en ljudkälla befinner sig i rummet samt hur denna ljudkälla interagerar med omgivningen erhålls på ett sådant sätt att det i en efterbearbetningsfas går att bestämma nivån på rumsakustiken. Eftersom tekniken bygger på två mikrofoner som sitter nära varandra medför detta små fasfel. Detta innebär att ljudkällan och rumsakustiken spelas in vid samma tillfälle.

Fördelar med MS-teknologin

Positiv effekt med MS-teknologin är att den slutliga matriseringen/mixen inte behöver göras vid inspelningstillfället. Vilket innebär att karaktären på inspelningen sätts under inspelningstillfället däremot kan nivån på rumsakustiken bestämmas efter inspelningstillfället. När alla ljudkällor och mikrofoner är placerade som det är tänkt i rummet blir inspelningen enkel att genomföra. Det behövs relativt lite utrustning för att göra tämligen omfattande inspelningar. För att slutresultatet skall bli så bra som möjligt är det nödvändigt att artister, producenter samt ljudtekniker både lyssnar och kan kommunicera med varandra.

Nackdelar med MS-teknologin

Negativ effekt med MS-teknologin är att det till exempel inte går att ändra nivån av individuella ljudkällor i en efterarbetningsfas. Det går heller inte att placera om individuella ljudkällor i en efterbearbetningsfas. Om behov av att justera ljudnivån eller placeringen av någon individuell ljudkälla uppstår, måste ljudkällan flyttas till den önskade positionen relativt mikrofonerna. Vilket kan komma att försvåra både möjlig efterbearbetning men också och kanske viktigast

arbetssituationen med artisterna.

En annan och ofta svårbemästrad begränsning är målsättningen att få en användbar

helhetsavbildning av skeendet på scenen. Den inbördes placeringen av artister och mikrofoner kan kräva en hel del ansträngning, då det lyckas kan ett riktigt bra resultat uppnås.

Som alternativ till ovanstående teknik är det möjligt att ”lägga ut” ett inspelat ljud till vilken högtalare som helst eller en kombination av flera. Detta kan presenteras i exempelvis ett 5.1 eller 7.1 ljudsystem.

7.3 Slutsatser

• Teoriprövningen med två mikrofoner gick inte att verifiera. Utifrån detta kan ingen generell slutsats dras. Under andra förutsättningar är måhända verifiering möjlig.

• Teoriprövningen med tre mikrofoner verifierades. Det gick att bestämma i vilken kvadrant en ljudkälla befinner sig.

• Att använda sig av försökspersoner för att verifiera en teori kan ifrågasättas, dock kan konstateras att metoden gav såväl korrekta, entydiga som reproducerbara resultat.

7.4 Förslag till fortsatt forskning

Ur undersökningens resultat framkom följande frågeställningar: • Hur kan validitet säkerställas vid mätningar av ljud?

• Hur kan relationen mellan vad som låter sig mätas och vad som de facto upplevs undersökas?

(15)

10

8. Referenser

Alexander, Robert Charles. (1999). The inventor of stereo The life and works of Alan Dower

Blumlein. Focal Press. ISBN 0-240-51628-1

Blumlein, Alan Dower (1931) Patent 394,325. Brittiska patentverket. Återges i dess helhet i Streicher & Everest, (1998). The New Stereo Soundbook. 2 uppl. Passadena: Audio

Engineering Associates

Boré, Gerhart. (1956). Priciples and Problems of Sterophonic Transmission. Georg Neumann, Laboratorium für Elektroakustik G.m.b.H . Berlin

(16)

11

Appendix

Vid konstruktion av mikrofonkapsel uppmäts bland annat känsligheten, denna redovisas i ett polärdiagram med olika kurvor redovisade för lämpliga frekvenser. Dessa olika kurvor beroende på dess form har kommit att kallas exempelvis ”cardioid, kula och åtta”.

(17)

12

(18)

13

(19)

14

Figur

4

. Figuren visar frekvensgång och polärdiagram för Neumannmikrofonen U77.

Referenser