• No results found

En utifrån lyssnares preferenser jämförande undersökning av digital och analog inspelningsutrustning med ljud konverterat till CD-ljudstandarden

N/A
N/A
Protected

Academic year: 2021

Share "En utifrån lyssnares preferenser jämförande undersökning av digital och analog inspelningsutrustning med ljud konverterat till CD-ljudstandarden"

Copied!
42
0
0

Loading.... (view fulltext now)

Full text

(1)2004:089. C-UPPSATS En utifrån lyssnares preferenser jämförande undersökning av digital och analog inspelningsutrustning med ljud konverterat till CD-ljudstandarden. Jonas Andersson. C-uppsats Institutionen för Musikhögskolan. 2004:089 - ISSN: 1402-1773 - ISRN: LTU-CUPP--04/089--SE.

(2) C-uppsats. En utifrån lyssnares preferenser jämförande undersökning av digital och analog inspelningsutrustning med ljud konverterat till CD-ljudstandarden.. Jonas Andersson 2004-04-29 Handledare: Jan Berg.

(3) Abstrakt Inom den digitala ljudtekniken råder idag bithysteri. Nya ljudinspelningssystem med allt högre digital upplösning skapas. Däremot dominerar fortfarande CD-skivan med sina 16 bitar och 44.1 kHz. Är tävlingen om bitarna helt i onödan i avseende på den färdiga produktens ljudupplevelse? Detta arbete försöker utröna om det är möjligt att höra skillnad mellan musikstycken inspelade på olika maskiner i olika upplösning och sedan konverterade till CD-standarden. En grupp lyssnare fick i uppgift att rangordna inspelningarna efter sina individuella preferenser. Därefter söktes en statistisk signifikans utifrån testresultatet. Försöket visar att det även med professionell lyssningsutrustning är svårt att höra skillnad mellan såväl apparaterna som den digitala upplösningen i vilken ljuden spelades in..

(4) Innehåll. 1.. Inledning ...........................................................................................................3 1.1. Sammanfattning........................................................................................3 1.2. CD-ljudstandardens historia...................................................................3 1.3. Syfte ............................................................................................................3 1.4. Ljudteori.....................................................................................................4 1.4.1. Inledning ...........................................................................................4 1.4.2. A/D-omvandling ..............................................................................4 1.4.3. Nyquists samplingsteorem.............................................................7 1.4.4. Dither och noise shaping ................................................................8 1.4.5. Sammanfattning ...............................................................................9. 2.. Metod................................................................................................................10 2.1. Val av metod ...........................................................................................10 2.2. Studioinspelning.....................................................................................10 2.2.1. Val av musikinstrument................................................................10 2.2.2. Val av försöksutrustning...............................................................10 2.3. Mixning....................................................................................................12 2.4. Egna teorier .............................................................................................13. 3.. Lyssningstestet ...............................................................................................14 3.1. Bakgrund .................................................................................................14 3.2. Försöket....................................................................................................14 3.3. Statistisk metod.......................................................................................16 3.3.1. Inledning .........................................................................................16 3.3.2. Statistisk signifikans ......................................................................16 3.3.3. Kruskal-Wallis Test of one-way anova .......................................16 3.3.4. Correcting for ties ..........................................................................16. 4.. Resultat och diskussion ................................................................................18 4.1. Testresultat ..............................................................................................18 4.2. Diskussion ...............................................................................................18 4.3. Självkritik.................................................................................................19 4.4. Slutsatser..................................................................................................20. 5.. Källförteckning...............................................................................................23. 6.. Bilagor 6.1. Handbok, testprogrammet 6.2. Testdata 6.3. Utskrifter, StatGraphics 6.4. Anvisningar till lyssningstest.

(5) 1. Inledning 1.1 Sammanfattning När formatet för CD-skivan fastslogs på den första delen av 1980-talet, bestämdes att den digitala upplösningen på ljudet skulle vara 16 bitar med en samplingsfrekvens på 44.1 kHz. I dagens moderna studios används i digital väg nästan uteslutande utrustning som arbetar i 20 bitar eller mera. Fortfarande lever emellertid den analoga bandspelaren kvar och favoriseras av många ljudtekniker och producenter över hela världen. Det finns flera olika analoga och digitala tekniker att hantera ljudet i studion vid inspelnings- och mixningstillfället. Men när det når den stora lyssnarskaran, ”marknaden”, finns det idag bara ett dominerande format; CD-skivan med sina 16bitar. Det jag i den här rapporten försökt komma fram till är om en van lyssnare, från en CD-skiva, kan höra ljudmässig skillnad mellan inspelningar gjorda med olika inspelningsutrustning, i vissa fall med olika hög upplösning och sedan reducerat till 16 bitar med olika A/D-omvandlare1. Ett lyssningstest genomfördes för en mindre skara vana lyssnare, som ombads rangordna efter vad han/hon tyckte lät bäst2. Ett dataprogram samlade in data från lyssnarna och resultatet analyserades sedan i ett statistikdataprogram.. 1.2 Syfte Anledningen till uppkomsten av detta arbete är att diskussionen om antalet bitar vid inspelningstillfället blivit en så central fråga bland ljudtekniker och producenter att dessa till slut kanske bryr sig mera om just bitantalet än ljudupplevelsen. Syftet var att undersöka om det fanns en metod – ett tillvägagångssätt vid inspelning och mixning – som gav lyssnaren det mest uppskattade ljudet. Av denna anledning valde jag att på olika sätt omvandla bitarna till 16 (i de fall det behövdes).. 1.3 CD-ljudstandardens historia Redan 1969 hade den holländske fysikern Klass Compaan, anställd av Philips, tagit fram en idé till att lagra analog bildinformation på en skiva av glas. Inom ett år hade han med hjälp av kollegan Piet Kramer utvecklat den första prototypen, till vilken man bestämde att en laser skulle vara bäst på att läsa informationen. Teknikerna försökte översätta sin glasskive-idé till att kunna hålla ljud istället för bild. På skivan, som mätte 30 cm i diameter, kunde man rymma 48 timmar analog musik, men en dåvarande Philips-chef, Lou Ottens, som varit med vid utvecklingen till 60talets ”Compact Cassette”, visste att formatet var alldeles för stort för att kunna hålla i längden och skapade därför ”Compact Disc”. Men försök visade att den analoga ljudsignal som skivan lagrade var alldeles för dålig. Under tiden hade den digitala ljudinspelningsindustrin vunnit stor mark och studios började installera digital 1 2. Analog- till digitalomvandlare. Eng, ADC – Analog to Digital Converter. Se bilaga 6.3 ”Anvisningar till lyssningstest”.. 3.

(6) Inledning. utrustning i hög utsträckning. Teknikerna vid Philips fick upp ögonen för den stora marknad som låg framför dem och började arbeta på en digital lösning för Compaans uppfinning. Man fick snabbt fram en prototyp med 44 kHz samplingsfrekvens och 14 bitars amplitudupplösning, som spelade enkanaligt ljud med 80 dB signalbrusförhållande, vilket var en stor framgång i jämförelse med LPreferensen. Samtidigt hade ett flertal andra företag på egen hand vidareutvecklat Philips idé och man insåg att detta behövde standardiseras. 1978 hölls en dedikerad mässa för digitalt ljud i Tokyo där de ledande företagen kom överens om diverse standarder för CD-specifikationen. Bl.a. bestämde man att det material som var lämpligast som CD-material var polykarbonat och att skivan skulle spela inifrån och ut. Man satte diametern till 115 mm för att rymma 14-bitars ljud. 1979 hade Philips efter många års forskande utvecklat den första fungerande CD-spelarprototypen. Man presenterade innovationen för ett flertal företag, av vilka Sony accepterade ett samarbete. Redan då började diskussionerna om vilken kvalitet ljudet skulle hålla. Sony ville ha 50 kHz samplingsfrekvens till skillnad från Philips önskan, 44 050 Hz. Kompromissen sattes som bekant till 44.1 kHz. Efter jämförande tester övergav Philips sina 14 bitar till förmån för Sonys 16. Därför tvingades man också göra skivan större (120 mm) för att få plats med den extra informationen. Den totala speltiden bestämdes till 74 minuter – enligt rykten för att få plats med Beethovens nionde symfoni. [Pohlmann, 1989] CD:n introducerades på marknaden som en helt överlägsen ljudupplevelse – och än idag talas det ju faktiskt om ”CD-kvalitet” som något alldeles extra. Även om knastret från LP-skivorna helt var borta var det något annat som hade hänt till ljudets nackdel. Vissa ljudkonnässörer rynkade på näsan och hävdade att detta inte alls var bättre än den gamla analoga tekniken – snarare tvärtom.. 1.4 Ljudteori 1.4.1 Inledning Idag eftersträvar vi att göra inspelningar med så högt bitvärde (upplösning) som möjligt, men det media som idag dominerar är fortfarande CD-skivan med sina 16 bitar/44.1 kHz. Finns det då någon anledning till denna bithysteri i inspelningsstudion? Det är av denna anledning jag valde att testa olika inspelningssituationer för att se om det spelar någon roll var någonstans i produktionskedjan dessa 16 bitar når oss. Är det så att man får ”bättre ljud” om man spelar in och arbetar i så hög upplösning som möjligt innan man ”samplar ner” till 16 bitar? Med största sannolikhet är det så, men är det något man uppfattar i dagligt lyssnande? För att förstå vari problematiken ligger för digitalt ljud, följer här en kort sammanfattning i digital ljudteknik.. 1.4.2 A/D-omvandling Ljud som vi hör är analogt och beskrivs som tryckvariationer, eller förtätningar och förtunningar i luften. Dessa brukar visualiseras i tvådimensionella ”vågor”. Vid analog inspelning av ljud skrivs helt enkelt en avteckning av dessa vågor in på. 4.

(7) Ljudteori. någon form av analog lagringsmedia3 och återges även analogt vid avspelning genom en högtalare.. dB. tid. 0. Figur 1.1 En enkel avbildning av ljudvågor i form av analoga elektriska vågor. (De tre nedanstående bilderna från skolverket.se). När man talar om digitalt ljud, menas ett analogt ljud som på något ställe på vägen mot inspelning eller avspelning har konverterats till en dataström istället för en analog vågform. Denna omvandling sker i flera steg, av vilka de mest elementära är sampling4 och kvantisering5. I ett digitalt system måste som sagt ljudet utgöras av en dataström. För att uppnå detta måste ljudvågen samplas. När man samplar kan man säga att man undersöker vågformens nivå vid ett visst tillfälle. Beroende på hur många gånger man undersöker vågformen får man en mer eller mindre exakt kopia av den. Det är härifrån vi känner igen CD-skivans 44.1 kHz, dvs. 44 100 samplingar per sekund. dB. 0. tid. Figur 1.2 Ljudvågen har i omvandlingsprocessen delats in i 8 samplingar.. Eftersom ett digitalt system aldrig kan ha oändlig upplösning måste sampelnivåerna avrundas till en nivå som tillåts av systemets bitupplösning – detta kallas kvantisering. dB. 0. tid. Figur 1.3 Amplituden justeras (kvantiseras) till närmaste nivå. Sex nivåer blir ”2.5 bitar”.. 3. Ex. rullband, kassettband, LP-skiva. ”Provtagning”. 5 eng. quantizing ung. ”justering”. 4. 5.

(8) Inledning. En CD-skiva har då 16 bitar nivåer, d.v.s. 65 536 olika amplitudnivåer. Det kan ju låta tillräckligt, men om man betänker att 24 bitar ger 16 777 216 nivåer, alltså 256 gånger fler nivåer, förstår man skillnaden lite bättre. Dessutom är den allra högsta amplitudnivån lika med det starkaste ljud som ett system klarar av att återge, och den används inte ofta. Det kanske bara är de 10 första bitarna som aktivt används i en produktion, åtminstone i ett ljudsvagt stycke. Då blir naturligtvis amplitudnivåerna ännu färre, d.v.s. lägre bitdjup och upplösning. Det är en annan av nackdelarna i jämförelse med system med högre bitdjup. Sampling och kvantisering ingår i den del av den komplexa analog-till-digitalomvandlingen som kallas sample and hold. Skissen nedan visar schematiskt av vilka block hela digitaliseringsprocessen6 är uppbyggd.. Analog ljudingång (V). Linjeförstärkare. Antialiasingfilter. Sample and hold. Dither (brus-) generator. Analog ljudingång (H). Linjeförstärkare. A/Domvandlare. Multiplexer. Antialiasingfilter. Sample and hold. Error correction. Record modulation. Lagringsmedium. A/Domvandlare. Figur 1.4 Blockskiss över A/D-omvandlingen. Som synes en avancerad process i många steg.. Det ger oss frågan om det mänskliga örat i optimala lyssningsförhållanden kan höra skillnad på hur denna A/D-omvandling sker. Dvs. om man direkt i apparaten gör 16 bitar av den analoga inspelningen, eller spelar in i 24 bitar och sedan samplar ner till 16, eller spelar in helt analogt och använder en extern, ”professionell” A/Domvandlare. Har detta sedan betydelse i hur det presenteras för lyssnaren; stereo, mono, och de båda med ambiensmikrofoner. Det är detta jag vill utröna med mina tester. För att lättare illustrera skillnaderna som finns mellan olika bitdjup, visar bilderna nedan i grova drag vad som händer med ljudvågen vid en konvertering.. 6. I denna text berörs av utrymmesskäl endast de mest grundläggande och lättöverskådliga delarna i A/Domvandlingen.. 6.

(9) Ljudteori. Figur 1.5 Ett stycke ljud i 44.1 kHz / 16 bitar (CD-kvalitet). Utskrift från Cool Edit Pro7.. Figur 1.6 Samma stycke i 44.1 kHz / 4 bitar. Man ”ser” tydligt de 16 olika amplitudnivåerna. Resultatet blir en ansenlig mängd oljud i form av kvantiseringsdistorsion.. Skillnaderna mellan 16 och t.ex. 24 bitar är naturligtvis inte lika synliga som på bilderna, men man får ändå en uppfattning av betydelsen av ett högt bitantal. Här har vi fått prov på ett par ganska betydande nackdelar med den digitala ljuddomänen. En CD-skiva kan inte återge frekvenser över 22 050 Hz och lägger distorsion till ljudbilden. Dessutom bör man ha i åtanke att de mest signifikanta bitarna8, som innehåller de absolut starkaste ljuden, inte används i alla produktioner, vilket gör att några bitar kanske försvinner. Skillnaden mellan 16 och 24 bitar blir då än mer påtaglig.. 1.4.3 Nyquists samplingsteorem För att ett digitalt medium/ljudsystem ska kunna presentera det mänskliga örats hela frekvensspektrum (ofta avrundat till 20 – 20000 Hz) krävs en samplingsfrekvens som är minst dubbelt så hög som den högsta frekvensen man vill återge – detta enligt det fundamentala samplingsteorem som tillskrivs Harold Nyquist. Allt under denna samplingsfrekvens kommer att resultera i vikningsdistorsion, eller s.k. aliasing. Beroende på att frekvenser över halva samplingsfrekvensen kommer att 7 8. Syntrillium Software.. Eng. MSB – Most Significant Bit. 7.

(10) Inledning. återspeglas som oönskade kopior i form av lågfrekvent ljud (på lika långt avstånd som samplingsfrekvensen, ”spegling”), måste all digital inspelningsutrustning berikas med ett anti-aliasingfilter, dvs. ett brant lågpassfilter som tar bort de höga frekvenserna innan de ”viks” ned i det lågfrekventa området. Teoretiskt sett blir alltså den högsta frekvensen som är möjlig att höra från en CD-skiva, 22 050 Hz.. f s ≥ f max ⋅ 2 Figur 1.7 Nyquists samplingsteorem.. Harold Nyquist, ingenjör vid Bell Telephone Laboratories, fann detta redan på 1930talet i sin forskning. Detta teorem har sedan dess varit en grundsten för en stor del av forskning och utbildning inom ljudområdet och hans namn nämns än idag i samband med detta. 1.4.4 Dither och noise shaping Dither är nödvändigt att lägga till signalen för att minska den hörbara distorsion som uppstår vid bitreducering till 16 bitar. Dither består helt enkelt av ett svagt brus som blandas med signalen i konverteringsprocessen. Vid ett lågt bitantal (16 eller lägre) är dither ett måste för att ljudet ska bli behagligt. Fördelen märks främst i svaga partier där kvantiseringsdistorsionen är särskilt hörbar. Eftersom distorsion är ett resultat av den inkommande signalen är det i ständig förändring. Det leder till att hjärnan tolkar distorsionen som en signal som utgör något viktigt i ljudstycket och därför koncentrerar sig på det. Man kan därför säga att man byter ut den oönskade distorsionen mot ett behagligare periodiskt brus. Kvantiseringsdistorsion blir aldrig starkare än 0.5 LSB9, d.v.s. halva den minst signifikanta biten (svagaste ljudet). [Martin, 2002]. Därför blir betydelsen av dither onödigt vid höga bitantal eftersom man då har fler bitar för att representera den övriga signalen. För varje bit som adderas i upplösning vinns 6dB i dynamik, eller en halvering av kvantiseringsdistorsionen. Detta ger en inblick i hur betydelsefullt det egentligen är vid reducering från t.ex. 24 till 16 bitar, då man förlorar 48dB i dynamik som medför en ökning av kvantiseringsdistorsionen med 8 gånger. [McCanna, 1998] Flera typer av dither finns, som uppför sig på olika sätt. Den enklaste formen är Rectangular, där brusnivån är beroende av aktuell ljudnivå – bruset höjs i starka partier och vice versa. Något mer avancerade metoder som är baserade på olika matematiskt uträknade slumptalsgeneratorer och ger bättre resultat är Triangular (triangulär sannolikhet) och Gaussian (klockkurvsannolikhet). Ett av de vanligast nyttjade är Highpass triangular. Highpass betyder att dither-bruset är fördelat till de frekvenser där örat är mindre känsligt, dvs. diskanten. Detta är den flitigast använda dither-metoden, som vanligen genererar det bästa resultatet. Noise shaping används vid bitreducering som ett komplement till dither. Det packar ihop det pålagda ditherbruset till en smalare bandbredd, men med högre amplitud, och lägger det högst uppe i diskantregistret – i höjd med halva samplingsfrekvensen. 9. Eng. Least Significant Bit. 8.

(11) Ljudteori. (Nyquist-frekvensen). Det lämpar sig därför dåligt i samplingsfrekvenser under 44.1 kHz. Vid 22 kHz samplingsfrekvens t.ex. skulle det mesta av dither-bruset lägga sig vid 11 kHz, som är ett känsligt område för det mänskliga örat. [Sonic Foundry, 2001]. 1.4.5 Sammanfattning Vad är det då som gör att det inte är högre samplingsfrekvens och bitantal på en CD-skiva? När CD-skivan utvecklades på 70-talet, fanns helt enkelt inte tekniken som tillät detta. Överföringshastigheten hos ett system som hanterar ljudfiler med CD-kvalitet i stereo, dvs. två kanaler, fås genom enkel matematik:. 44 100 ⋅16 ⋅ 2 = 1 411 200 bit/s Det krävs alltså grovt räknat en överföringshastighet på 1.4 Mbit/sekund för att skicka en ljudfil i stereo i ett digitalt system. Ljudfilen ändras till 96 kHz/32 bitar:. 96 000 ⋅ 32 ⋅ 2 = 6144000 bit/s Detta betyder att samma ljudfil nu kräver en konstant överföringshastighet på mer än 6 Mbit/s. Ett av svaren heter alltså överföringshastighet och rent generellt kan man säga att detta är något man inte kan få för mycket av. Det andra är att CD-skivorna rent utrymmesmässigt inte kan tillhandahålla i närheten av det informationsutrymme som ett ljud i riktigt hög upplösning kräver. Tillverkningsutrustningen var helt enkelt inte tillräckligt förfinad. Dessa två villkor är alltså det som CD-uppfinnarna fick kompromissa mellan.. 9.

(12) 2. Metod 2.1 Val av metod Till försöket skapades ett antal ljudexempel, akustiskt inspelade i studio. Ljudsignalerna vid varje inspelning lagrades på ett antal inspelningsmaskiner av olika digital karaktär, samt en analog. De färdiga inspelningarna fick sedan en testperson i ett lyssningstest till uppgift att efter egna preferenser rangordna med hjälp av ett dataprogram och digitala ljudfiler.. 2.2 Studioinspelning 2.2.1 Val av instrument När det gäller lyssningstest av den här typen är det viktigt att som ansvarig välja ljud som är ”lättlyssnade” och som lyssnaren kan identifiera sig med. Av den anledningen valdes rena musikinstrument som ljudexempel framför syntetiska ljud. Man skulle kunna spela in brus eller sinustoner som lyssnaren sedan ska få bedöma – men i detta fall skulle det snarare trötta ut lyssnaren än ge trovärdiga data. Soloinstrument kändes som ett bättre alternativ att använda till inspelningen än en hel poplåt. Det blir stora dynamiska skillnader och en mindre medeleffekt i musiken, vilket medför färre bitrepresentationer som i det avseendet borde göra det lättare för lyssnaren att hitta skillnader mellan apparaterna. ”Vanliga” instrument, till skillnad från en aldrig tidigare inspelad poplåt, har lyssnaren alltid en bild av i huvudet hur de låter och jämför mot detta. Valet av soloinstrument grundar sig på att få så stor variation som möjligt i avseende på dynamik och frekvensomfång. Därför användes piano som har både attack och lång klang. Virveltrumma som åstadkommer ett transient ljud som är snabbt avtagande och utnyttjar mycket av bitarna och borde därför få A/D-omvandlarna att uppföra sig olika. Det sista instrumentet, saxofon, är ett vanligt soloinstrument som med sitt ”fyrkantsvågsliknande” ljud är ett bra komplement till de övriga två. 2.2.2 Val av försöksutrustning Valet av testmaskiner grundar sig dels på vad som oftast brukas i ljudingenjörsutbildningen10 och vad som används i inspelningsbranschen som helhet. (Se Figur 2.1).. 10. Vid musikhögskolan i Piteå. 10.

(13) Försöket. Apparat. A/D-omvandlare. Studer 2” (analog) Sony PCM-R700 DAT (16 bitar) Digidesign Pro Tools (16 bitar) Digidesign Pro Tools (24 bitar) Tascam DA-88 (16 bitar). Apogee Rosetta Intern Intern Intern 24 bitar – Sound Forge 16 bitar Intern. Figur 2.1 De inspelningsmaskiner och A/D-omvandlare som jämfördes i testet.. Eftersom DAT11-maskinen bara är en tvåkanalig utrustning och försöket krävde fyra kanaler, användes två likadana kalibrerade DAT:ar från Sony. Två olika Pro Tools Digi001-system med olika bitdjup, en Tascam DA-88 samt en analog Studer 2”bandspelare utgjorde den övriga testparken. Samtliga maskiner kopplades upp på olika utgångar från huvudmixerbordet, SSL12 G+ 4500.. In (4) Ut (20) Digi 001 16bit Digi 001 24bit Sony DAT 1&2 Tascam DA-88 Studer 2” SSL G+ 4500 Figur 2.2 Uppkopplingen i kontrollrummet där fyra insignaler delades upp och skickades till totalt tjugo utgångar som kopplades till inspelningsapparaternas ingångar.. Två mikrofoner, AKG C-414 TL2, sattes upp i Studio 113 i en X/Ystereokonfiguration14 med en inbördes vinkel på cirka 90º. I addition till detta monterades två rundtagande Neumann TLM-50 längre bort i lokalen som ambiensmikrofoner enligt Figur 2.3. Mikrofonkonfigurationen bygger inte på några speciella vetenskapligt bevisade tester, utan är en av de vanligaste typerna av mikrofonplacering vid inspelningar av det här slaget. Mikrofonerna är vanligt förekommande och kombinationen av riktade/rundtagande karaktäristik är allmänt känd i inspelningskretsar vid samtidig inspelning av både direktljud och ambiensljud. Dessutom är inte mikrofonkvaliteten den avgörande faktorn i detta test.. 11. Digital Audio Tape Sonic State Logic 13 i musikhögskolan i Piteå 14 stereoinspelningsteknik där de två mikrofonerna sitter i samma punkt, vinklade åt olika håll, för att få bra mono-/ stereokompatibilitet 12. 11.

(14) Mixning. Insignalen från mikrofonerna delades efter det analoga mixerbordet, SSL G+ 4500, rakt av till de fem inspelningsstationerna. Som visas i Figur 2.2, användes fyra mikrofoner som alla spelades in direkt till band. Inspelningsnivåerna justerades så insignalen blev lika stark på varje maskin, och de synkroniserades med en sinuston för att lättare kunna klippas exakt lika långa i efterbearbetningen. Däremot kalibrerades aldrig nivån helt exakt mellan utrustningarna. Det förutsattes att de var korrekt kalibrerade utifrån den referensnivå som stod angiven på bandspelarna. Förutom att ställa nivå på insignalerna, och få signalerna genom samma mikrofonförstärkare, fungerade mixerbordet nästan mer som en ren splitbox (signalfördelare).. AKG C-414. NEUMANN TLM-50. 8. 6. Figur 2.3 Mikrofonplaceringen vid inspelningsförfarandet. Två AKG C-414 TL2 som huvudmikrofoner i en X/Y-konfiguration i samma punkt för att undvika fasfel vid mixning till mono. Som ambiensmikrofoner användes rundtagande Neumann TLM-50. (Ungefärligt avstånd i meter.). 2.3 Mixning Samtliga inspelningar mixades i fyra olika utföranden: • • • •. mono utan ambiens mono med ambiens stereo utan ambiens stereo med ambiens. Detta för att få en bild av om det är lättare att höra skillnader i ljuden under olika förutsättningar, dvs. fler kanaler inblandade och med det högre bakgrundsbrus. De ljud som spelades in på den analoga Studer-bandspelaren, digitalkonverterades i efterhand till 16 bitar med en A/D-omvandlare från Apogee, modellen Rosetta. Anledningen till valet av just den är att det är en helt oberoende (extern) maskin, som därför borde ge ett annorlunda ljud än de andra omvandlarna. Den är dessutom väldigt ofta använd och får bra kritik av ljudtekniker.. 12.

(15) Försöket. Samtliga inspelningar lästes sedan på ett eller annat sätt digitalt in i Pro Tools15, där ambiensmikrofonerna mixades till ljuden och de sista små nivåjusteringarna gjordes efter analys av de inledande sinustonerna före varje fil. I experimentet förutsattes att det digitaliserade ljudet inte skulle påverkas ytterligare vid en digital överföring. Därefter överfördes samtliga ljudfiler till Cool Edit Pro16, där de klipptes in på sampelnivå exakt lika långa, för att lyssnaren inte ska kunna bilda sig en uppfattning om vilken maskin som är vilken enbart baserat på längden av ljudspåren. Valet av programmet till just klippningen grundar sig inte på något annat än att det är ett bra och lätthanterligt verktyg som lämpar sig bra till den typen av operationer. Tilläggas bör att de ljud som spelades in i upplösningen 24 bitar, fick behålla dessa bitar i det längsta, såtillvida att klippning och mixning gjordes i 24 bitar, innan reduceringen. Vid konverteringen från 24 till 16 bitar, användes så kallade highpass contour noise shaping och highpass triangular dither i Sound Forge 5.0.17 Se avsnitt 1.3.4.. 2.4 Egna teorier Vid en snabb förhandstitt på de ingående testmaskinerna bildar man sig snabbt en uppfattning om vilken som bör vara den bästa. Mina egna tankar gick på detta sätt: Det som i teorin borde vara av ”högst” ljudlig kvalitet är något som är så analogt som möjligt. Därför kan man tycka att de ljud som spelades in analogt skulle få högst betyg av lyssnarna, eftersom det där användes en företagspatenterad A/Domvandlingsalgoritm ner till 16 bitar (Apogee Rosetta). En annan kandidat skulle kunna vara Pro-Tools-sessionen i 24 bitar, som bitreducerades i programmet Sound Forge. Med andra ord kan man gissa att i de fall där inspelningen sker i så hög bitupplösning som möjligt och reduceringen görs i efterhand, får man den högsta ljudkvaliteten som då också borde ge bäst betyg i ett rangordningstest. Det skulle alltså innebära att DAT-, DA-88-, och Pro-Tools-inspelningen som gjordes i 16 bitar är sämre ljudkvalitetsmässigt än de övriga. Frågan är alltså om lyssnarna kan uppfatta detta?. 15. Digidesign vid tiden för experimentet, Syntrillium, numera Adobe. 17 Sonic Foundry 16. 13.

(16) 3. Lyssningstestet 3.1 Bakgrund Lyssningstest är en ofta använd forskningsmetod inom ljudområdet. Fördelarna gentemot rena mättester är många, men säkrast resultat fås, om möjligt, genom en kombination av metoderna. På det sättet kan man t.ex. styrka sina testresultat med överensstämmande mätningar. Det finns ett närmast oändligt antal sätt att genomföra ett lyssningstest. Valet av metod är helt beroende på vilken typ av test man ska göra. I vissa fall räcker det kanske att jämföra två objekt åt gången och välja bort det bättre eller sämre, medan man som testperson i ett annat fall kan ha ett hundratal att särskilja, genom antingen rangordning eller någon form av värdesättning på en graderad eller steglös skala. Nuförtiden används med fördel en dator som hjälpmedel, naturligtvis för att underlätta för lyssnaren, men även för att göra det lättare och säkrare för forskaren att lagra och hantera testdata direkt i datorn för analys. Vidare kan man använda antingen högtalare eller hörlurar, återigen helt beroende på typ av test. Högtalare ger kanske en bättre bild av verkligheten i många fall, medan hörlurar kan vara bra om man vill hitta små skillnader i ljud som skulle vara svåra att urskilja i vanliga högtalare.. 3.2 Försöket Lyssningstestet genomfördes med dator som hjälpmedel. Som lyssningsutrustning användes ett ljudkort av märket Turtle Beach Montego 2 med optisk digital utgång till en D/A-omvandlare från M Audio, Super DAC 2496, sedan vidare till hörlurar av märket Stax, modell SRM-Xh. Ett testprogram, för ändamålet skapat i Visual Basic, spelade upp de olika exemplen enligt ordningen i Figur 3.1.. 1. Piano i stereo utan ambiens 2. Piano i mono utan ambiens 3. Piano i stereo med ambiens 4. Piano i mono med ambiens 5. Saxofon i stereo utan ambiens 6. Saxofon i mono utan ambiens 7. Saxofon i stereo med ambiens 8. Saxofon i mono med ambiens 9. Virvel i stereo utan ambiens 10. Virvel i mono utan ambiens 11. Virvel i stereo med ambiens 12. Virvel i mono med ambiens Figur 3.1 Ordningen på testen lyssnaren genomgår. Alla tolv exempel är indelat i fem olika ljud som representerar de maskiner som använts i testet.. 14.

(17) Lyssningstestet. Uppgiften för lyssnaren var att på en skala mellan ett och fem placeringssätta (rangordna) de fem maskinerna med avseende på ljudupplevelsen. Anvisningarna som fanns tillhands bad denne rangordna efter sina egna preferenser, dvs. den som enligt honom/henne ”lät bäst” gavs helt enkelt placeringen ett o.s.v. i fallande ordning18.. Figur 3.2 Gränssnittet i testprogrammets övningsdel. De stora knapparna representerar varsin maskin, vars ordning slumpas från gång till gång. Under var och en av dessa bestämmer lyssnaren vilken placering ett ljud får i ett visst test.. Programmet består enkelt uttryckt av fem olika knappar – som representerar maskinerna – med tillhörande ”slider”, där man anger placeringen just den maskinen ska få i ett visst test. Man kan inte ge två ljud samma placering utan är tvungen att försöka hitta någon skillnad. Kan man inte särskilja två ljud får man sätta olika betyg, men skriva ner vilka det handlar om på en stencil som finns vid lyssningsstationen. Detta är för att lyssnaren ska koncentrera sig så mycket som möjligt och hitta olikheter på samtliga ljud. Han är själv inte medveten om vad det är som testas eller i vilken ordning. Mellan testdelarna slumpas placeringen av maskinerna för att undvika att göra det alldeles för enkelt för testpersonerna. I programmet lagras testpersonens data i en textfil och överförs sedan till statistikprogrammet StatGraphics, där resultatet presenteras och om möjligt en ”vinnare” utses. Se bilaga för ytterligare instruktioner om handhavandet av lyssningsprogrammet.. 18. Rangordning. 15.

(18) Statistisk metod. 3.3 Statistisk metod 3.3.1 Inledning Beroende på vilken typ av forskning man gör finns olika statistiska metoder för att beräkna resultatet. Metoderna består av matematiska formler, som med korrekta inparametrar kan producera ett resultat, ofta i form av ett decimaltal, vars värde och relevans man kan avläsa i speciella tabeller. Numera finns speciella statistikdataprogram för att underlätta och säkerställa beräkningarna. I det här fallet användes en metod som går att beräkna med programmet StatGraphics. Värdena från försökspersonerna skrivs in i ett datablad, varpå programmet efter användarens valda kriterier, genomför de statistiska uträkningarna. 3.3.2 Statistisk signifikans För att man inom statistiken ska kunna säga att något är statistiskt bevisat, krävs att resultaten är sannolika till en viss procent. Ju lägre sannolikhet att man drar en felaktig slutsats desto starkare är bevisningen. Detta kallas statistisk signifikans och ligger någonstans mellan 90-99%, beroende på tillämpning. I detta försök användes 95% som signifikansnivå, vilket är det vanligaste i akademiska experiment av den här typen. 3.3.3 Kruskal-Wallis Test of one-way anova När det handlar om en rangordning av olika data – i det här fallet i vilken ordning de testade inspelningsmaskinerna hamnar inbördes med avseende på lyssnarnas individuella preferenser – kan användas en statistisk metod som kallas KruskalWallis Test of one-way anova. Det är en icke-parametrisk metod som går ut på att man jämför rankade data hos två eller flera grupper, idealisk för ett rangordningstest av den här typen. Formeln antar att medianen hos jämförelseobjekten är lika.. K N +1 12  H= ni  R i −  ∑ 2  N ( N + 1) i =1 . 2. N = totala antalet samples (data). ni = antalet objekt i en nominal kategori. Ri = summan av en kategori.. Figur 3.3 Formeln för Kruskal-Wallis Test.. 3.3.4 Correcting for ties I många statistiska test av rangordningstyp ger man samtliga inblandade objekt en inbördes placering, men i det här fallet finns som bekant bara fem placeringar att dela ut. Det innebär att objekten flera gånger kommer att tilldelas samma placering men under olika förutsättningar. Uppstår ett fall med många lika placeringar, finns ett tillägg till formeln ovan som kallas Correcting for ties. (Se nästa sida.). 16.

(19) Lyssningstestet. C = 1−. ∑T N3 − N. T = t 3 − t där t = antalet lika placeringar i varje testgrupp N = Det sammanlagda antalet objekt (utdelade placeringar). Figur 3.4 Tillägget Correcting for ties.. Correcting for ties sägs ge en bättre säkerhet för fall där man har många lika placeringar. I detta test skulle man ha klarat sig utan tillägget om jag hade valt att låta lyssnaren rangordna alla inspelningar och förutsättningar individuellt, dvs. från placeringen 1 till 60. Exempelvis om lyssnaren hade gillat DAT-systemet bäst i mono med ambiens, skulle han ge den förutsättningen placeringen 1 osv. Nu är detta inte fallet så man kan utgå från att formeln bör tillämpas, då man kan förutsätta att just lika placeringar kommer inträffa. Denna implementeras sedan enkelt i huvudformeln enligt nedan.. H* = H / C. Figur 3.5 Tillägget Correcting for ties implementerat i Kruskal-Wallis test.. 17.

(20) 4. Resultat och diskussion 4.1 Testresultat De värden som mina försökspersoner genererat fördes in i statistikdataprogrammet StatGraphics. Först jämfördes värdena för inspelningsapparaterna med varandra utan hänsyn till musikinstrument eller mixningsprocedur, dvs. de totala resultaten. Kan man redan i det läget finna en stor resultatmässig spridning mellan apparaterna och kan man dra slutsatser utifrån detta? I det här fallet syntes ingen signifikant skillnad, även om man klart och tydligt ser på grafiken att extremvärdena har ett betydligt större spann för den analoga inspelningen. Men här låg p-värdet på strax över tillåtna 0.05 (0.0578), så statistiskt går då inte att dra några slutsatser – anledning fanns att analysera djupare. Det man däremot direkt kan se, som framgår av bild 6.1, är att en apparat skiljer sig nämnvärt från de övriga och inte minst medianvärdet visar på att den ansågs, i klarspråk, sämre än de övriga. Tänjer man alltså lite på gränsen för statistiken kan man säga att det är till 94% säkert att någon av apparaterna skiljer sig från de andra överlag. Lite förvånande är att det går att hitta signifikans vid saxofoninspelningen, utan hänsyn till övriga parametrar, (bild6.3), men inte i de inspelningarna andra i samma situation. Där kan man säkerställa att den analoga inspelningen överlag får en sämre placering i skalan än de andra. Däremot gäller detta inte för vare sig pianot (bild 6.2) eller virveltrumman (bild 6.4). Om man studerar det generella resultatet på saxofonen i mono kontra stereo kan man se att p-värdet i mono blir 0.2, dvs. ingen signifikans, medan man i stereo får värdet 0.0503, dvs. väldigt nära signifikans. Lägger man däremot ambiensmikrofonerna till detta, höjs p-värdet igen till ca 0.2. Tittar man på resultatet för de individuella inspelningsapparaterna i samtliga övriga fall finns ingen statistisk signifikans att finna någonstans. Även vid en genomgång av de individuella svaren ser man att det fluktuerar mycket – något som bekräftas av svårigheten att finna signifikans. Den inspelningsmaskin som får allra flest extremvärden är den analoga. De fåtal exemplar av den stencil som delades ut vid testtillfället jag fick tillbaka, var väldigt lika och bekräftade det jag hade på känn innan. De innehöll endast kommentarer om att vissa ljud lät väldigt lika och att de därför var mycket svåra att särskilja, samt att den brusiga inspelningen skilde sig markant. Därför togs ingen hänsyn till dessa i slutanalysen. Testet tog ca 60 minuter att genomföra i genomsnitt, men extremvärdena sträckte sig från 30 minuter ända upp till 90 minuter.. 4.2 Diskussion Hjärnan är bra på att maskera de periodiska signalerna som adderat dither ger upphov till, vilket medför att man till slut inte bryr sig om att det brusar [McCanna,. 18.

(21) Resultat. 1998]. Det skulle alltså kunna betyda att vi hör, men inte registrerar skillnaderna i bruset mellan 16 och 24 bitar. I den analoga inspelningen däremot där brusnivån ligger klart högre än de andra, skulle man kunna tänka sig en splittring hos lyssnarna – vissa kanske uppskattar ”vintage”-ljudet som det ger, medan andra anser det vara en kvalitetsmässig försämring i deras öron. Personligen tror jag att det i dagligt lyssnande på populärmusik inte alls har betydelse vilket bidjup man lyssnar på. Fördelarna med 24 bitar ligger mer i att få ett större dynamiskt omfång vid mixningen än minskad kvantiseringsdistorsion, även om dessa naturligtvis går hand i hand. Det är nog bara med utrustning av väldigt hög kvalitet man kan höra en klar skillnad. Däremot om man lyssnar till ett väldigt dynamiskt varierande orkesterstycke inspelat på många kanaler kan förutsättningarna vara helt annorlunda, men jag tror ändå att det är väldigt svårt att höra klara skillnader hemma i sitt stereosystem, där den allra största delen av musiklyssning ändå sker. Det är av största vikt hur frågan till lyssnarna formuleras så de är på det klara med ”hur” de ska lyssna och bedöma. Skillnaden mellan ljudkvalitet och individuell preferens är i vissa fall milsvid. Det kan leda till problem hos lyssnaren om han/hon inte riktigt vet hur han/hon ska bedöma. ”Det här tycker jag låter bättre, men det är helt klart av sämre ljudteknisk kvalitet”, skulle ett dilemma hos lyssnaren kunna se ut. Därför måste man vara specifik i sin fråga till lyssnaren om vad det är som gäller, så att han/hon är klar över sin uppgift. ”-Är det överhuvudtaget någon skillnad?”, ”-Mitt självförtroende åkte i botten!”, ”Jag orkade inte göra hela testet…” var några kommentarer från testpersonerna. Detta kan ju tyda på att en viss svårighet att utnämna en testvinnare föreligger. De personer som deltog i testet får betraktas som väldigt erfarna lyssnare, dels rent musikmässigt naturligtvis, men de har dessutom ett flertal andra lyssningstest bakom sig, vilket får anses vara ett stort plus i sammanhanget. Som jag tidigare skrev, kan man nog i förväg tycka att skillnaderna mellan inspelningarna bör vara små – kanske på gränsen till akustiskt minimala – men att testpersonerna med den högkvalitativa lyssningsutrustning testdatorn tillhandahöll, ändå borde ha kunnat urskilja en vinnare. Att detta nu inte inträffade, hittar jag ingen annan anledning till än att skillnaderna mellan de olika inspelningsmaskinerna, i det inspelningssätt som användes i detta test, är så väldigt små att det med ganska stor säkerhet är försumbart. Därmed vill jag absolut inte säga att det är så i samtliga produktioner runt om i musikvärldens studior. Tvärtom tror jag att man kan hitta betydande olikheter beroende på hur man utnyttjar bitarna som står till förfogande i de olika systemen. Hade man i detta test gjort allehanda efterbearbetningar, såsom reverbpålägg, komprimering och andra effekter, skulle utgången av testet med största sannolikhet te sig helt annorlunda. Då hade man nog kunnat tala om olika karaktärer på inspelningarna snarare än försöka urskilja minimala skillnader i kvantiseringsdistorsion och dither-brus. De musikinstrument som användes är bra exempel på soloinstrument som borde lämpa sig bra till den här typen av test. Något intressant som framkom var att vissa försökspersoner faktiskt föredrog den brusiga, halvt misslyckade inspelningen framför de andra vid enstaka tillfällen, medan andra lyssnare vid samma förutsättning gav den sämst placering. Det går därför inte att peka på någon speciell förutsättning, utan förklaringen får bli att. 19.

(22) Slutsatser. folks, inte minst ljudtekniker, preferenser är så pass olika. Väldigt sällan gavs bruset en placering i mitten av rangskalan, och därför får man då dessa extremvärdesskillnader som gör det svårt att få ett ”statistiskt intressant” värde. Om man studerar bild 6.3 ser man att DAT-maskinen får ett väldigt spann mellan sina extremvärden – något som bara den analoga uppvisat tidigare. Liknande kan ses hos det 16 bitars Pro-Tools-systemet i bild 6.4. Varför det hände just i dessa situationer har jag inte funnit något svar på. Men faktum kvarstår – en del föredrar, under vissa stimuli, en brusig inspelning. Kanske hade man med en stor mängd lyssnare kunnat hitta ett mönster och fler signifikanta skillnader, men personligen har jag mycket svårt att tänka mig det. Efter att själv har gjort testet inser jag ju hur svårt det är. En annan förklaring kan även vara otydliga anvisningar, eller olika tolkningar av desamma. Under förutsättningen att alla testpersoner var vana lyssnare och kritiker och hade på sig hörlurar till ett värde ett stort antal tusen kronor utan att ändå kunna vara säkra på sin sak, är det ju lätt att inse att folket i hemmet sittande i soffan vid en vanlig stereoanläggning inte skulle ha en chans att höra skillnad.. 4.3 Självkritik Den analoga inspelningen blev tyvärr inte alls lika bra som förväntat. På grund av min önskan att lämna ljuden så opåverkade som möjligt, valde jag att stänga av brusreduceringen19 som finns till Studer-bandspelaren. Detta medförde en kraftigt ökad brusnivå jämfört med de andra ljuden, som gör den väldigt lätt att skilja ur mängden. Det mixerbord som användes har enligt florerande rykten också en tendens att brusa speciellt mycket på de utgångar som går till bandspelaren – något som jag vid inspelningstillfället inte var medveten om. Man måste hålla inspelningsnivån på gränsen till överstyrning för att komma tillrätta med problemet. Dessutom är ju analoga band i allmänhet brusiga om man inte mättar banden tillräckligt. Dessvärre vet nu lyssnaren från test till test vilken av maskinerna som är den brusiga och kan nog ganska enkelt gissa att det handlar om den analoga maskinen, då digitala diton av professionell kvalitet sällan uppvisar samma dåliga signalbrusförhållande. Det går inte att komma ifrån att man per automatik reagerar på brus – konstanta eller inte – i jämförelse med brusfria alternativ, och därför blir antagligen betyget ett helt annat än om den vore mindre brusig. Å andra sidan var det inte helt klart att den brusiga inspelningen alltid uppfattades som sämst, vilket jag hela tiden trodde. Detta diskuteras senare. Mängden testpersoner kan alltid diskuteras vid ett sådant här experiment. En enkel gällande regel är naturligtvis – ju fler, desto bättre. Min målsättning var att få minst 12 testpersoner, men jag fick nöja mig med 10 sedan två fallit bort i sista stund av beklagliga anledningar. Felaktiga resultat kan också uppkomma genom ett felaktigt testprogram. Det kan tänkas att resultatet kunde påverkas genom att jag alltid hade instrumenten i samma ordning i testtillfället. Det betyder att alla öron var trötta när ljudfilerna med 19. Dolby NR. 20.

(23) Resultat. virveltrumman spelades. Naturligtvis hade jag slumpat även ordningen på dessa om jag tänkt på det, för att försöka eliminera fler extremvärden.. 4.4 Slutsatser Denna rapport har alltså visat att det (under förutsättningarna i testet) inte går att säkerställa att inspelningar gjorda i 24 bitar, bitreducerade till 16 bitar skulle vara av märkbart högre ljudlig kvalitet än inspelningar från början gjorda i 16 bitar. Men det lämnar många frågor att undersöka vidare: Hur viktig är karaktären på ditherbruset? Vilken dither-typ fungerar bäst i praktiken? Vad är den praktiska skillnaden mellan 24 bitar och 32 bitar floating point?. 21.

(24) 22.

(25) 5. Källförteckning Referenser Andy Bailey, Network Technology for Digital Audio (Focal Press, 2002) Ken C. Pohlmann, Principles of Digital Audio (SAMS, 1989) Ken C. Pohlmann, The Compact Disc Handbook (A-R Editions, 1992) John Watkinson, An introduction to Digital Audio (Focal Press, 1994) Norman R. Kurtz, Statistical Analysis for the Social Sciences (Pearson Allyn & Bacon, 1998) Louis Cohen & Michael Holiday, Practical Statistics for Students (Paul Chapman publications, 1996) Webbreferenser Sonic Foundry http://www.sonicfoundry.com Geoff Martin, Introduction to sound recording http://www.tonmeister.ca Dan Heend, The 24-bit Field Recording FAQ http://www.24bitfaq.org Earlevel http://www.earlevel.com James McCanna, What’s the dither all about http://www.pcrecording.com Per Lannerö, Digitalt ljud http://www.skolverket.se/skolnet/smultron/ljud.htm. 23.

(26) Tack till Jan Berg. för värdefull hjälp och inspirerande handledning.. Markus Sundström Andreas Renhorn Daniel Hellström. för trogen och hjälpfull assistans vid inspelningarna. för utbytande av idéer och erfarenheter. för stor hjälp med VB, samt idéer till rapportlayouten.. Musiker Jan Johansson Piano. Tomas Johannesson Saxofon. John Best Slagverk. ( Johan Persson, Lis-Beth Heikki, Fredrik Lundgren). Alla som gjorde lyssningstestet.. 24.

(27) 6. Bilagor 6.1 Handbok, testprogrammet Testprogrammet installeras i en egen mapp, och ljuden läggs i en undermapp som måste ges namnet ”ljud”. Dessa ljud måste i sin tur ha vissa förutbestämda filnamn, som programmet vid uppspelning söker efter. Första siffran i namnet anger inspelningsapparat enligt följande lista: 1. 2. 3. 4. 5.. Pro Tools 16 bitar Pro Tools 24 bitar Tascam DA-88 Sony PCM R-700 DAT Studer Analog. Nästa siffra/siffror i filnamnet anger vilket ”fall” som ska testas, i ordningen enligt figur 3.1. Ex. En fil med namnet ’310.wav’ anger alltså att ljudet är inspelat med Tascam DA-88 och innehåller virveltrumma i mono utan ambiensmikrofoner. Programmet startas med filen ’Lyssningstest.exe’. I den ruta som dyker upp skriver man sitt namn. För att inleda övningsfasen skriver man namnet ”Test”.. Figur 6.1 Välkomstrutan i programmet Lyssningstest.. Övningsfasen är exakt som det riktiga testet, förutom att man bara lyssnar på några av testdelarna och inget av det man anger sparas i någon fil. Man kan när som helst avsluta övningsfasen, men den avslutas automatiskt efter fem betygsättningsrundor. När den fasen är klar, startar man programmet igen på samma sätt, men skriver den här gången sitt namn för att starta det ”riktiga” testet. Programmet är utrustat med fem stora knappar som representerar varsin maskin. Vilken maskin som ligger bakom knapparna ändras för varje gång testet körs, i slumpvis ordning. Under varje knapp finns en tillhörande kontroll som är indelad i fem nivåer – stegen utgör ljudens placering från ett till fem, där ett är bäst och fem.

(28) Bilagor. sämst. När någon av knapparna trycks ned startar ljudet som ligger bakom den knappen omedelbart, samtidigt som en liten markör dyker upp ovanför det ljud som spelas. Detta för att underlätta när man sätter sina betyg så att man kommer ihåg vilket ljud som spelades sist. Det spelande ljudet avslutas så fort man trycker på stoppknappen, eller på ett annat ljud. De betygsätts av användaren, och samtliga placeringar måste delas ut i programmet – annars kan man inte gå vidare. Två ljud i ett och samma test får alltså inte tilldelas samma placering. När lyssnaren är nöjd med sin ”betygsättning” trycker han/hon på knappen ’Gå vidare’ för att komma till nästa test.. Figur 6.2 Grafiskt gränssnitt i programmet.. Alla data skrivs till en loggfil som heter ’log.txt’, som automatiskt läggs i samma mapp som huvudprogrammet. Därifrån får man sedan manuellt överföra datat till ett statistikprogram. I figur 6.3 syns ett utdrag ur den loggfilen.. 26.

(29) Handbok, testprogrammet. ******************************************* Gert Palmcrantz Apparat Placering DEL 1 --------------------------------Pro Tools 16 1 Pro Tools 24 3 Tascam DA-88 2 Sony PCM 700 5 Studer Analog 4 Apparat Placering DEL 2 --------------------------------Studer Analog 3 Tascam DA-88 2 Pro Tools 24 4 Pro Tools 16 1 Sony PCM 700 5 Figur 6.3 Utdrag ur loggfilen.. För att underlätta efterarbetet, får varje testperson en egen ”avdelning” i textfilen, där även testdelarna är klart uppdelade. I slutet av varje persons test får man i textfilen den tid det tagit för honom/henne att genomföra hela testet. Detta är endast för att se om någon har jäktat sig genom testet, så den personen eventuellt kan strykas från den slutliga statistiska beräkningen..

(30) 6.3 Testdata Testdel 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12. Person 1 PT 16 1 4 2 4 4 2 1 1 4 2 5 1 Person 2 2 1 3 1 1 4 4 2 1 3 5 5 Person 3 5 4 4 4 5 3 4 2 5 1 2 1 Person 4 5 3 5 1 3 1 5 1 1 4 5 5 Person 5 4 4 3 4 1 4 4 4 5 4 3 2. PT 24 3 2 3 3 2 3 2 4 1 1 2 5. Utrustning DAT 4 3 1 2 1 4 3 2 2 3 1 3. DA-88 2 1 4 1 3 1 4 3 3 4 4 4. STUDER 5 5 5 5 5 5 5 5 5 5 3 2. 3 2 4 4 3 2 3 5 2 2 3 1. 4 5 2 2 4 1 1 4 4 1 1 2. 1 3 1 3 2 3 2 3 5 4 2 4. 5 4 5 5 5 5 5 1 3 5 4 5. 2 3 2 1 3 2 2 3 3 2 5 2. 4 1 5 2 2 5 1 1 4 5 3 4. 1 5 3 5 1 4 3 4 2 4 1 5. 3 2 1 3 4 1 5 5 1 3 4 3. 2 4 4 5 4 4 3 4 2 5 3 4. 4 1 2 3 1 2 2 5 3 3 4 3. 3 5 3 4 2 3 1 3 5 1 2 1. 1 2 1 2 5 5 4 2 4 2 1 2. 2 3 5 5 3 2 1 2 4 5 4 4. 5 2 4 2 2 1 2 1 3 2 5 5. 3 5 2 3 4 3 3 3 2 3 2 3. 1 1 1 1 5 5 5 5 1 1 1 1.

(31) Testdata. Person 6 1 2 3 4 5 6 7 8 9 10 11 12. 3 3 3 4 3 3 3 5 5 3 2 5. 1 5 4 2 4 2 4 2 1 4 3 1. 2 4 5 3 5 4 5 4 4 2 1 4. 4 1 2 1 2 5 2 3 2 5 4 2. 5 2 1 5 1 1 1 1 3 1 5 3. 2 3 2 4 3 1 2 3 5 4 5 5. 5 5 4 3 2 2 1 2 2 2 2 2. 3 2 1 2 1 4 3 1 3 3 1 3. 1 1 3 1 4 3 4 4 1 1 4 4. 4 4 5 5 5 5 5 5 4 5 3 1. 4 2 3 2 2 3 2 3 3 2 3 3. 1 4 2 3 3 4 3 4 4 5 1 2. 3 1 1 1 1 2 1 1 1 3 2 4. 2 3 4 4 4 1 4 2 2 1 4 1. 5 5 5 5 5 5 5 5 5 5 5 5. 5 3 4 2 3 3 4 2 2 4 5 5. 4 2 2 5 2 2 3 3 3 1 2 4. 2 4 5 4 5 5 5 5 4 5 4 3. 3 5 3 3 4 4 2 4 5 3 3 2. 1 1 1 1 1 1 1 1 1 2 1 1. 2 1 2 2 1 5 3 1 1 4 3 3. 1 3 5 4 4 3 1 4 4 5 1 1. 4 2 4 1 5 1 5 3 2 3 5 2. 5 4 1 3 2 2 4 2 3 1 2 5. 3 5 3 5 3 4 2 5 5 2 4 4. Person 7 1 2 3 4 5 6 7 8 9 10 11 12 Person 8 1 2 3 4 5 6 7 8 9 10 11 12 Person 9 1 2 3 4 5 6 7 8 9 10 11 12 Person 10 1 2 3 4 5 6 7 8 9 10 11 12.

(32) 6.4 Utskrifter, StatGraphics. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.1 Box- and Whisker-plot för samtliga instrument och mixningar. +-tecknet anger medelvärdet och det horisontella, mittre strecket visar medianen. Notera att högre siffra ger sämre betyg.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.2 Box- and Whisker-plot för piano sett över alla mixningar.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.3 Box- and Whisker-plot för saxofon sett över alla mixningar..

(33) Utskrifter, StatGraphics. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.4 Box- and Whisker-plot för virveltrumma sett över alla mixningar.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.5 Box- and Whisker-plot för piano i stereo utan ambiens.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.6 Box- and Whisker-plot för piano i stereo med ambiens..

(34) Bilagor. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.7 Box- and Whisker-plot för piano i mono utan ambiens.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.8 Box- and Whisker-plot för piano i mono med ambiens.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.9 Box- and Whisker-plot för saxofon i stereo utan ambiens.. 32.

(35) Utskrifter, StatGraphics. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.10 Box- and Whisker-plot för saxofon i stereo med ambiens.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.11 Box- and Whisker-plot för saxofon i mono utan ambiens.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.12 Box- and Whisker-plot för saxofon i mono med ambiens..

(36) Bilagor. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.13 Box- and Whisker-plot för virvel i stereo utan ambiens.. Box-and-Whisker Plot. response. 5 4 3 2 1 0 pt16. pt24. dat. da88. studer. Figur 6.14 Box- and Whisker-plot för virvel i stereo med ambiens.. Box-and-Whisker Plot. response. 5 4 3 2 1 0 pt16. pt24. dat. da88. studer. Figur 6.15 Box- and Whisker-plot för virvel i mono utan ambiens.. 34.

(37) Utskrifter, StatGraphics. Box-and-Whisker Plot. response. 5 4 3 2 1 0 pt16. pt24. dat. da88. studer. Figur 6.16 Box- and Whisker-plot för virvel i mono med ambiens.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.17 Box- and Whisker-plot för piano i stereo utan hänsyn till ambiensmikrofoner.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.18 Box- and Whisker-plot för piano i mono utan hänsyn till ambiensmikrofoner..

(38) Bilagor. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.19 Box- and Whisker-plot för saxofon i stereo utan hänsyn till ambiensmikrofoner.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.20 Box- and Whisker-plot för saxofon i mono utan hänsyn till ambiensmikrofoner.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.21 Box- and Whisker-plot för virvel i stereo utan hänsyn till ambiensmikrofoner.. 36.

(39) Utskrifter, StatGraphics. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.22 Box- and Whisker-plot för virvel i mono utan hänsyn till ambiensmikrofoner.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.23 Box- and Whisker-plot för piano med ambiensmikrofoner utan hänsyn mono/stereo.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.24 Box- and Whisker-plot för piano utan ambiensmikrofoner utan hänsyn mono/stereo..

(40) Bilagor. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.25 Box- and Whisker-plot för saxofon med ambiensmikrofoner utan hänsyn mono/stereo.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.26 Box- and Whisker-plot för saxofon utan ambiensmikrofoner utan hänsyn mono/stereo.. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.27 Box- and Whisker-plot för virvel med ambiensmikrofoner utan hänsyn mono/stereo.. 38.

(41) Utskrifter, StatGraphics. Box-and-Whisker Plot. response. 5 4 3 2 1 0. pt16. pt24. dat. da88. studer. Figur 6.28 Box- and Whisker-plot för virvel utan ambiensmikrofoner utan hänsyn mono/stereo..

(42) Bilagor. Anvisningar till lyssningstest Välkommen till lyssningstestet! Läs detta blad noggrant innan du börjar. Översikt Det här testet går ut på att bedöma fem olika inspelningsförfaranden. Ljuden har behandlats olika vid inspelnings- och mixtillfället. Din uppgift är att, med avseende på dina preferenser, rangordna ljuden i tolv olika fall. Programmet består av ett huvudfönster med fem stora knappar, vilka representerar varsitt ljud. Under knapparna finns en tillhörande ”slider” för bedömning. Det ljud som du anser låter bäst erhåller således placeringen 1, osv. i fallande ordning. Lyssningstestet består av en övningsfas med fem deltest och en huvudfas med tolv deltest. Så här gör du: ● Öppna programmet ”Lyssningstest Jonas”, som ligger på skrivbordet. Om det är första gången du använder programmet ska du börja med att ange namnet Test i rutan som dyker upp. Detta för dig in i lyssningstestets övningsfas. Övningsfasen Övningsfasen ser exakt ut som det ”riktiga” testet, men är endast till för att du ska vänja dig vid programmets och ljudens utformning. Med andra ord; inga av dina bedömningar sparas och evalueras. Lyssna noga på ljuden som döljer sig bakom knapparna och tilldela placeringar enligt dina egna bedömningar och kriterier av vad som låter bra. När du har gett alla fem ljuden placeringar från 1 (bäst) till 5 (sämst), trycker du på knappen ”Gå vidare Æ”. Observera att två ljud ej kan ges samma placering i rangordningen. Efter fem omgångar tackar programmet för sig och du ombedes starta det igen. Det finns en stoppknapp för att stoppa det för tillfället ljudande exemplet. Du kan också när som helst trycka på en knapp för att lyssna på ett annat ljud, även om ett ljud redan är under uppspelning. ● Starta programmet igen och skriv ditt namn för att beträda lyssningstestets huvudfas. Huvudfasen Huvudfasen består av tolv deltest, där varje del (precis som övningsfasen) innehåller fem ljud. Ge det ljud du tycker låter bäst placeringen 1 och det som är sämst betyget 5. Efter att alla ljud tilldelats en placering trycker du på knappen ”Gå vidare Æ”, vilket för dig till nästa deltest och fem nya ljud som ska betygsättas. Efter att alla tolv deltest är genomförda, är lyssningstestet slut. Om det finns ljud som du absolut inte kan särskilja kvalitetsmässigt från varandra, har du möjligheten att skriva ner detta på stencilen som ligger bredvid lyssningsdatorn. (Eftersom du inte kan sätta samma betyg, får du ge olika betyg och föra ner dina tankar på stencilen). Stencilen kan du lägga i mitt fack efter testets slut. Testet tar ungefär en halvtimme, men jag rekommenderar en liten bensträckare efter övningsfasen för att få nya krafter! Notera att… ● det är inte betyg som sätts, utan placeringar där 1 är bäst och 5 är sämst. ● ordningen i vilken ljuden presenteras på skärmen slumpas från gång till gång. ● du kan alltid avbryta ett pågående ljud för att lyssna på ett annat. ● Vila dina öron och din hjärna! Lycka till!. 40. Jonas Andersson, 0705926244.

(43)

References

Related documents

Del av befintlig väg 588 vid Sävastån övergår till enskild väg, se plankarta 1 00 T 02 30 Del av befintlig väg 585, Färjeleden, vid trafikplats Norra Sunderbyn som inte samman-

En betesmark (2/800) med påtagligt naturvärde (objekt 40, NVI 2018) kopplat till flera äldre och grova ekar samt riklig förekomst av stenrösen påverkas av ny enskild väg� Den

De två största orsakerna till skillnad i resultat mellan analogt och digitalt summerade mixar påstås vara dels att fler DA-omvandlare används vid analog summering, vilket

När fler hushåll delar tvättstuga bör det beaktas att hushållen utöver de normala tvättpass som behövs för veckotvätt, måste få utrymme för spontan tvätt. Det är just

Inom ramen för EU:s program för sysselsättning och social solidaritet (2007–2013) har också en publikation beställts vid namn ”Socialt ansvarsfull upphandling -

supply chains, industrial research, information management, blockchain, decision support systems, systematic literature review, distributed computer systems, supply

produkter. Produktutveckling berör företagets värdeskapande förslag, nyckelresurser, nyckelsamarbeten och nyckelaktiviteter. Boomerangs arbete kring hållbar utveckling berör

The aim of this study was twofold: to track whiskers from videos in head- fixed, free whisking mice from two groups, without markers or trimming; and to investigate the