• No results found

Inst. för Talöverföring

N/A
N/A
Protected

Academic year: 2021

Share "Inst. för Talöverföring "

Copied!
174
0
0

Loading.... (view fulltext now)

Full text

(1)

KONTAKTMIKROB'ONER OCH STÖRNINGSREDUCERANDE MIKROPONER

S~rskilt med tanke pä automatisk tal igenkänning

Hans Sohlström Examensarbete 1977

Inst. för Talöverföring

KTH

(2)

SAMMANFATTNING

När taligenkänningssystem ska användas praktiskt är det ofta i bullriga omgivningar. Undersökningen är ett för- sök att teoretiskt och praktiskt jämföra olika typer av störningsreducerande mikrofoner. Jämförelsen gäller både ljudkvaliteten i allmänhet och mikrofonernas egenskaper för automatisk taligenkänning .i synnerhet.

Ljudkvaliteten ,har undersökts dels genom mätningar i eko- fritt rum, dels genom studier av mikrofonernas talåter- givning. Det senare har skett med hjälp av olika typer

2

av spektrogram för tal, upptaget via de olika mikrofonerna.

Mikrofonernas lämplighet i samband med automatisk tal igen- känning har provats genom igenkänningsförsök, både med och utan bakgrundsbuller.

De jämförda mikrofontyperna är ; en riktmikrofon, två närmikrofoner av tryckgradienttyp samt en kontaktmikrofon.

För den senare har olika placeringar provats. Kontaktmik- rofonen har ägnats speciell uppmärksamhet eftersom den

representerar en helt annan princip än de andra mikrofonerna.

Användning av kontaktmikrofon ger en förvrängning av talet, vilken beror på mikrofonens placering. I undersökningen har två placeringar använts, på halsen och på pannan.

Spektrogram för ett urval av fonem, inspelade dels via

"

kontaktmikrofon i dessa placeringar, dels via en normal referensmikrofon finns samlade i APPENDIX efter sid 133.

Kontaktfuikrofonplaceringen på halsen visade sig ge en återgivning tillräckligt naturlig både för allmän använd- ning och för automatisk talignkänning. Störningsundertryck- ningen var betydligt bättre än med de konventionella mik- rofonerna. De konventionella mikrofonerna undertryckte låg- frekvent buller relativt dåligt. Detta gav problem vid

taligenkänningen.

(3)

FÖRORD

Här vill jag tacka de som hjälpt mig med under- sölmingen - främst mina handledare Kjell Elenius och Mats Blomberg, men inte bara de utan även alla andra på institutionen.

Tack även t i l l Anne och Torbjörn där

he~~a,

som stått ut med att ha sin man respektive pap'pa hamrande på skrivmaskin om kvällarna de senaste månaderna.

Stockholm i december 1977

Hans Sohlström

3

(4)

INNEHÅLL

SAMMANFATTNING FÖRORD

INNEHÅLLSFÖRTECKNING

l INLEDNING, ÄMNE 'l' FÖR UNDERSÖKNINGEN

2 IGENKÄNNINGSSYSTEME'r

3 MIKROFON ALTERNATIV

2

3

4

7

10

3.1 Systemkrav på mikrofonen 17

3.2 Mikrofoner för taligenkänning i bullriga miljöer

3.3 Riktmikrofoner

3.4 Närmikrofoner av tryckgradienttyp

3.5 Kontaktmikrofoner

18

20

24

3.5.1 Princip 25

3.5.2 Kontaktmikrofonanvändning för tal 25 3.6 Omvandlingsprinciper

3.6.1 Konventionelllamikrofoner 30

3.6.2 Kontaktmikrofoner 31

3.7 Mikrofonerna i undersökningen 34

4 FÖRSÖKSUPPLÄGGNING

4.1 Inledning

4.2 Frekvensgång, rikningsegenskaper och avståndsdämpning

4.2.1 Teoretiskt 4.2.2 Praktiskt

4.2.3 Använd utrustning

4.3 Talåtergivning

4.3.1 Teoretiskt

4.3.2 Praktiskt

4.3.2.1 Inspelningsteknik och mätningar

4.3.2.2 Inläst text

4.3.2.3 Kommentar till formuläret

4.3.2.4. Spektral analys av inspelningarna

ho-_

47

49 17

5h 5L~

4.

(5)

5

4.3.3 Använd utrustning 4.4 Taligenkänningsförsöket

4.h.l Teoretiskt

L~.4.2 Praktisk utformning, bakgrundsbuller

4.h.3 Inspelad text

4.4.4 Praktisk utformning, bakgrundsbuller

Lj...4.5 Använd utrustning

MÄTRESULTNr 5·1 Inledning

5. 2 Sennheiser MD 421

utan med

5·3 Sennheiser headsetmikrofon 5·4 Rosiden KUC 7 001

5·5 Kontaktmikrofoner 5. 6 Sammanfattning

55 56

5~ 5 . 60 62

6)-1- 64 67 70 73 75 6 TALÄTERGIVNING

7

6.1 Inledning 76

6.2 Sennheiser MD 421 76

6.3 Sennheiser headsetmikrofon 78

6.4 KUC 7001 81

6.5 Kontaktmikrofon

6.5.1 I allmänhet 8h

6.5.2 Placering på pannan 84

6.5.3 Placering på halsen 92

6.5.4 Jämförelse av de båda placeringarna 98 RESULTAT AV TALIGENKÄNNINGSFÖRSÖKEN

7.1 Utan bakgrundsbuller 7.1.1 Inledning

7.1.2 MD 421

7.1.3 Sennheiser headsetmikrofon 7.1.4 KUC 7001

7.1.5 Kontaktmikrofon placerad på 7.1.6 Kontaktmikrofon placerad på 7.1.7 Diskussion

pannan halsen 7.2 Resultat av igenkänningsförsök med

bakgrundsbuller 7.2.1 Inledning

7.2.2 Resultat av försöken 7.2.3 Diskussion

7.3 Sammanfattande tabell

100 99 100 105' 1°5 112 116

117 119 127 129

5

(6)

1'50

LITTERATUR 132

Efter sidan 1'5'5 följer dessutom ett appendix med separat sidnumrering och innehållsförteck- ning. Det innehåller spektrogram över VOV och OVO-ord, upptagna dels med kontaktmikrofon, dels med referensmikrofon i ekofritt mätrum.

6

(7)

1 I NLEDN I NG:, ÄMNET FÖR

UNDERSÖKNINGEN

De första rapporterna om automatisk taligenkänning pub- licerades i början av 50-talet. Redan de första systemen redovisade goda resultat för en talare och en liten vo- kabulär. 1952 beskriver Davis, Biddulph och Balashek en apparat för igenkänning av siffrorna O t i l l 9. För en talare nådde man 97-99% rätt igenkänning. (l) , (2)

Till en början användes enbart analog teknik, men datorns tillkomst möjliggjorde mera sofistikerade system. De ti- diga systemens begränsning t i l l en talare var allvarlig och, har det visat sig, svår att kOl1h'TIa t i l l rätta med.

Det är först de senaste åren som man har kunnat nå

bra igenkänningsresultat för llokändall talare, dvs andra än de som systemet lärts upp på.

7

De första igenkänningssystemen byggde påmönsterigenkänning.

Ur den akustiska signalen beräknas ett antal parametrar.

Dessa bildar ett mångdimensionelIt mönster i tiden. Detta mönster jämföres sedan med lagrade jämförelsemönster. Sy-

stemet väljer det ord, vars jämförelsemönster i någon mening bäst liknar det aktuella. Mönsterigenkänningen leder ofta t i l l ett relativt stort talarberoende, samt känslighet för olika taltempo och bakgrundsbuller. Stort minnesbehov och lång processtid blir oc~så följden om man försöker göra vokabulären stor.

Mönsterigenkänningssystemen representerar i dag en av två huvudgrupper av system för automatisk taligenkänning.

Den andra huvudgruppen utgöres av de fonetiskt orientera-

de systemen. I dessa försöker man ur den akustiska signa-

len finna de enskilda fonemen, för att sedan med utgångs-

punkt från dessa söka identifiera orden. Denna typ av

system kan lättare göras talaroberoende. Minnesbehovet

för vokabulären blir också rimligare.

(8)

8

Taligenkänningssystemen har i dag nått så långt att de börjar bli kommersiellt användbara. En typisk användnings- situation är när en människa skall kommunicera med en dator och samtidigt använda händerna t i l l något annat.

En av de svårigheter som tillko~mer när taligenkänningen skall 'lämna laboratoriemil j ön är förekomsten av buller.

Det bästa är naturligtvis om man kan göra något åt bull- ret vid källan. Därmed vinner man ju också en tystare arbetsmiljö för systemanvändaren. Mindre realistiskt ter det sig att akustiskt isolera användaren~ Han antogs ju hela tiden syssla med något manuellt arbete.

Den möjlighet som återstår är att göra själva igenk;ännings- systemet okänsligt för buller. Detta kan göras på två

sätt. qels kan man använda en störningsreducerande mik- rofon för den akustisk"':elektriska (3,ignalomvandlingen, dels kan man extrahera informationen ur vågformen på ett sådant sätt att bullret har liten inverkan. För att ska- pa ett taligenkänningssystern som kan användas i bullriga lokaler torde man få använda sig av båda dessa metoder.

Mats Blomberg och Kjell Elenius vid institutionen för Talöverföring har utvecklat ett igenkänningssys.t!3ID för isolerade ord. Systemet är av den fonetiskt orienterade typen. Till detta ville man använda någon form av stör- ningsreducerande mikrofon. Man tänkte sig även att kunna använda en kontaktmikrofon placerad på den talande. Frå- gan var vilka typer av störningsreducerande mikrofoner som kunde användas tillsammans med igenkänningssystemet, och vilken grad av bullerundertryckning man kunde nå.

Denna undersökning, som gjorts som ett examensarbete vid institwtionen för talöverföring, och som härmed redovisas, utgör ett försök att besvara dessa frågor.

Någon tidigare undersökning av olika mikrofonalternativ

för taligenkänningssystem tycks inte finnas. Några rappor-

ter om igenkänningssystem behandlar kortfattat mikrofon-

(9)

valet, tex konstaterar T. Martin (3) att kontaktmikrofo- ner är oanvändbara och att man bör använda sig aven

tlclos e -talking, noise cancelling microphone tl •

Inte heller om kontaktmikrofonanvändning verkar det finnas någonting skrivet tidigare. Av denna anledning har en

del av undersökningen behandlat kontaktmikrofonanvändning för tal, detta för att klargöra vilka egenskaper kontakt- mikrofonen har vid olika placeringar.

( 4)

9

(10)

10

2 I GENKÄNN I NGSSYSTEMET

För att tolka resultaten av igenkänningsförsöken är det nödvändigt att förstå hur systemet arbetar. Först en be·- skrivning av den använda hårdvaran.

Dator CD 1700 med 16 k kärnminne, skivminnesenheter, bildskärmsterminal, plotter mm.

51-kanalig filterbank för talanalys med likriktare, glätt- ningsfil ter på 13 ms',' logaritmisk A/D-omvandlare t i l l varje kanal. på utgången finns en multplexer för sampel- värdena från de 51 kanalerna. På ingången finns pr~emfas

med 6 dB per oktav.

Fristående filter högpass 500 Hz, lågpass 330 Hz och all- pass med pr~emfas 6 dB per oktav. Filtren är utrustade med likriktare, glättningsfilter, A/D"':omvandl,are och multiplexer.

Hårdvaran är organiserad för taligenkänning enligt fig l .

Talsignalen t i l l systemet kan tex komma från en bandspela- re. Alla 54 kanalerna avkännes med en maximal samplings- frekvens av 100 ',Hz. Ur sampelvärdena beräknas 8 paramet- rar.

par O

l 2

3

4

5 6 7

totalintensitet med p~e~mfas 6 dB/Oktav

intensitet lågpass 330 Hz intensitet högpass 500 Hz

tyngdpunkt 0-800 Hz med pre(3mfas 6 dB/Oktav

medelintensitet 0-800 Hz med preemfas 6 dB/Oktav tyngdpunkt 700-3000 Hzmed preemi'as 6 dB/Oktav medelint. 700-3000 Hz med pre~mfas 6 dB/Oktav

tyngdpunkt par 5+200-3500 Hz med pre~mfas 6 dB/Okt

vid tonande ljud, tyngdpunkt par 5+200 - 5100 Hz

med pre~mfas 6 dB/Oktav vid tonJJ5sa' ljud

(11)

f-tJ

1-"

0q 1-'

iI!

PJO

~

p.,

<:

PJ

~

PJ

::3

(J.l

o

~ (]q

::3

PJ 1-"

(J.l

CD

>j 1-"

::3

(]q

Tal in

i - - f--

preemfas

f--

I--

- 6 dB/okt

L-

preemfas 6dB/okt

l . -

.,

Ifilter - L ikr. ~}[ättn loo, A D-omv

51 Likadana

filter lll·{r. glättn.

Log ... _

..

l i ~< r. g l ä tt n.

fr l ter

Log.

. ...

I l

f Il te r l i k r. g l ä t t n log.

I - dm

I U

. g L i t t l . a p

L l e x e r

r

1 - 0 m

n u o l

l t o I

I - g P

e l

x

e r

I -

l

r - -

l -

ADan;

I - -

D

A

T O

R

1-' 1-'

(12)

Parameter 3 och 4 kan för vokaler sägas ge ett mått på första formantens läge respektive styrka. På samma sätt beskriver 5 och 6 andra formanten. Parameter 7 beskriver .i någon mening läge t hos tredj e forman ten.

12

Dessa 8 parametrar läggs upp på skivminnet varje 10 ms.

Inspelningen av ett ord initieras när värdet av parameter l blir större än ett visst värde. För att inte missa ton- lösa ljud i början av ord sparas dessutom parametervärden för de närmast föregående 300 mS. Då värde av parameter O underskpider ett givet värde under en föreskriven tid detekteras ordslut.

Med utgångspunkt från parametertbellerna på skivminnet görs sedan en preliminär segmentering av orden. Detta görs dels som gränser mellan paus, tonlös och tonande ljud så som detta manifesteras av parameter o och l, dels i de tidpunkter där derivatan av parameter 2 har extrem- punkter .

Nästa fas är den styrda segmenteringen, då orden segmen- teras med ledning av den fonetiska beskrivning av orden i vokabulären som skall finnas i "lexikonet". Vid denna segmentering väljer systemet ut den preliminära segment- gräns i en viss tidslucka som har de för övergången i fråga mest typiska parametervärdena. Denna styrda segmen- tering görs för varje yttrande enligt alla orden i lexi- konet. Det ord vars parametervärden i varje segment när- mast liknar de värden som finn.s i den upplagda fonemsta-

tistiken väljs sedan ut som rätt.

Den för igenkänningen nödvändiga statistiken läggs upp med hjälp av ett särskilt program. Vokabulären läses där- vid in ett antal gånger och systemet som ska veta vilka ord det är fråga om, segmenterar orden efter sitt "facit".

Därefter beräknas medelvärden och varianser för de

(13)

fig 2 Exempel på resultatet av styrd segmentering efter IIfacit". Fem yttranden av "Adam!!. För varie yttrande visas förutom segmBnt~ränser

paraneter O t i l l 7 med början nerifrån.

13

(14)

fig 3 Exempel på styrd segmentering av hela vokabulären

efter "facit".

(15)

olika parametrarna i varje segment. Dessa sannolikhets- funktioner utnyttjas sedan vid igenkänningen för att ut- välja det "mest sannolika" ordet. Se ,figur 2 och, 3. _

15

För att göra beräkningsarbetet mindre kan man låta de preliminärt segmenterade orden genomgå en preliminärtest.

på grundval av den kan man utesluta "otänkbara" ord i lexikonet vid den slutgiltiga igenkänningstesten.

Systemet kan som tidigare nämnts sägas vara av den fone- tiskt orienterade typen. Orden delas upp i segment, un- gefär motsvarande fonem, innan igenkänningsförsök görs.

Detta medför att minnesbehovet för statistik reduceras avsevärt jä.mfört med ett mer mönsterigenkänningsorienterat system. Vokabulären kan därför göras ganska stor. För

närvarande används mest en 41 ords vokabulär. Den består av bokstaveringsorden, siffrorna från O till 9, samt or- den "mellanslag!! och !Imiss".

Om fonemstatistiken läggs upp på grundval av inspelningar med flera olika talare får man ett i stort sett talaro- beroende system. Variationen mellan de olika talarna kom- mer att manifesteras som "bredall sannolikhetsfUnktioner

ifonemsta tis tiken. Därmed kO.mmer systemet att acceptera större variation i parametervärden vid igenkänningen.

Om däremot facit läggs upp på grundval aven persons ytt- randen kommer spridningen mellan de olika yttrandena av

sam.ma ord bli liten. Detta medför en "smal" sannolikhets- funktion. Systemet blir då mer uttalat talarberoende.

I det olyckliga fallet att ~tatistiken,bygger på en per- sons yttranden och dessa dessutom är mycket lika varand- ra kan sannolikhetsfunktionerna bli mycket Ifsmala". I

värsta "fall kan det då inträffa att samma ord yttrat av

samma talare vid ett annat tillfälle kom.mer att avvika

så mycket/från !lfacit" att ordet ratas • Problemet skul-

le kunna undvikas om man lade villkor på sannolikhetsfunk-

tionerna som hindrade dem från att bli alltför smala.

(16)

16

Detta skulle emellertid göra systemet mindre generellt och komplicera vokabullirbyten. I stlillet får man vara upp- mlirksam på denna risk vid inspelningen av statistikmate- rialet. Sannolikhetsfunktionerna kan liven i ett olyckligt fall bli extremt "breda!!. Då kan vilket ord som helst komma att falla inom dessa sannolikhetsfunktioner och dlirmed ge ett felaktigt svar från systemet. Resultat som skulle kunna tyda på systembetenden av detta slag finns noterade i kapitel 7.

Systemet arbetar inte så mycket med den enskilda vågformen eller spektrumsektionen utan grundar sin igenklinning sna- rare på fonetiska aspekter av talet. Hlirigenom blir be- roendet av ljudkvalitet i form av bandbredd, distorsions- frihet och brusfrihet måttligt. Detta gör systemet väl

·llimpat att arbeta med olika former av störningsreduceran-

de mikrofoner, både i tyst och i bullersam omgivning.

(17)

3 MIKROFONALTERNATIV

3.1 SYSTEMKRAV PÅ MIKROFONEN

En mikrofon karakteriseras av sin frekvensgång,känslig- het, eventuell distorsion samt av sina riktningsegenska- per . För frelcvensgången gäller naturligtvis att den, för bästa igenkänningsresul ta t lL."lder ideala yttre förhållan- den, skall vara rak över ett så stort frekvens område som mcjjligt. Distorsionen skall naturligtvis alltid vara så liten som möjligt, samtigt som känsligheten skall vara så stor som möjligt. Vilken riktningskarakteristik mik- rofonen bör ha är mera oklart.

17

För det igenkännings system som använts vid försöken kan kraven på bredbandighet avsevärt reduceras. Inverkan av signaler med frekvenser över 4_kHz är obetydlig. Endast genom sitt bidrag t i l l parameter O, totalintensiteten, kOlmner de att påverkaigenkänningsresul ta tet. Den infor- mation som utvinnes ur de lägsta frekvenserna är huvud-

sakligen den eventuella förekomsten av grundton. Signaler med frekvenser under ca 100 Hz kommer därför att ha gans- ka liten inverkan.

Om mikrofonen framhäver vissa aspekter hos talet på be- kostnad av andra komuer detta att få en relativt liten inverkan om man gör både statistikuppläggning ocp igen- känningsförsök med samma mikrofon. Exempelvis framhäver en kontaktmikrofon placerad på halsen, som vi ska se i kapitel 6, de tonande ljuden på bekostnad av de tonlösa.

- .

detta kommer emellertid att få en begränsad betydelse

eftersom de tonande ljuden är framhävda även i "facit",

dvs fonemstatistiken.

(18)

18 3.2 MIKROFONEH FÖR TALIGENKÄNNING I BULLRIGA MILJÖER

Bulle1' är, ett ett oönskat ljud som stör upptagningen (inspelningen) av talet. Den störningsreducerande mikro- fonens uppgift är d~ att reducera inverkan av bullret p~

igenkänningsresultatet. Det finns en. principiell skillnad mellan detta och den störningsreducerande mikrofonens upp- gift i andra sammanhang, att reducera bullrets i.nverkan

p~ talets uppfattbarhet sett ur människans synpunkt.

Det använda systemet är uppbyggt p~ ett s~dant sätt att denna sklllnad är liten men inte helt oVäsentligo En be- skärning av det nedre frekvensomr~det. tex vid 300 Hz ger t i l l exempel en relativt ringa minskning av den mänsk- liga uppfattbarheten. Samma beskärning gör användningen av systemet nästan omöjlig. Informationen om grundtonen

g~r nämligen därvid förlorad. Skillnaden mellan tonande och tonlösa segment försvinner. Igenkänningssystemet kan inte p~ saITL1J.a sätt som människan rekonstruera grundtonen ur de transmitterade övertonerna. (5)

Andra igenkännings sys tem kan ge s t:"5rre skillnader. Hur

stora skillnaderna blir beror p~ hur Il mänskliga" de är (1), dvs i vilken utst:räckning systemen utnyttjar sarnma egen- skaper hos talet som människan gör vid sin taluppfattning.

Kravet p~ den störningsreducerande mikrofonen är att d~n

selektivt skall dämpa bullret utan att i n~gon betydelse- full grad förvränga talsignalen. Vad som avses med Ilbetydel- sefull grad" framg~r av stycke 3.1.

För att göra detta m~ste man utnyttja n~gon egenskap som skiljer buller och talljud. Om bullret skiljer sig i frek- vens fr~n talet, eller rättare, från de delar av talljuden

som ige~känningssystemet utnyttjar s~ är problemet rela-

tivt enkelt,. Mikrofonen bör då hel t enkel t göras okänslig för de frekvenser som bullerljudet innehåller. Vanligen filtrerar man i stället signalen efter mikrofonen, men

b~da alternativen förekommer och hal' häT' inte närmare

(19)

19

särskiljts. Båda teknikerna har benämi'1ts filtrering. I det fall bullerIjuden ligger inom det utnyttjade talspekt- rumet blir det mer komplicerat. Det gäller då att väga den informationsförlust som en filtrering skulle medföra mot den informationsförlust som bullret medför. Om ~an

tex har ett kraftigt buller som huvudsakligen består av diskreta frekvenskomponenter kan dessa bortfiltreras med relativt smala filter utan någon större informationsför- lust. Om däremot bullret är jämt fördelat över ett större frekvens oml" åde , vilket vanligen är fallet, måste andra aspekter hos ljudet utnyttjas för att särskiljg buller och talljud. I figur 4 visas några typiska bullerspektra.

aL

ToTA/..

Li!~EL.-7Y"'E~n·E~ NO';E

1----'--- - TOTAl..

LF-VEL.-$T"'!'I!fEr

N0ise .~--

..J

80

70 60

50

~40 ~ ~ __ TorA L LiVEL-Av.cRLii,eRkNo'SE

·~~RlrERM I

~ :ro

~ 20

~

~ ./0 41

O

~ -10

·20 -30

r---.

-

-40

,DO

ZOO

I~ ~ 4"" '-

---:::!.VER--w.e If1I ~"7~

...;;

r---::. ""M No/.,.e'~~

l--

. ---r--.. o,..."'§"

-..,

~ ~

-

','

~

" -f--.-.

400 600 800 1.000 ~OOO 4,000 6pOO 10,00 rl'ilf~IfNCY

fig 4 Bullerspektra enligt Fletcher (6)

Det som utöver frekvens innehållet karakteriserar ljudet är själva vågfrontens utseende och riktning.

Vågfrontens och därmed ljudets riktning utnyttjas som

särskiljande princip i alla riktmikrofoner. Vågfrontens

form utnyttjas i närmikrofoner av diffrentialtyp.

(20)

20

3.3 RIKTMIKROFONER

Den vanliga rundkännande mikrofonen ger en utsignal som beror av det momentana trycket i luften och därmed mot membranet. Den rundkännande mikrofonen kallas därför även tryckmikrofon.

Riktmikrofoner är i varierande grad i

ställe~

känsliga för tryckgradienter och koxnmer därför att vara olika käns- liga för ljudfält med olika riktningar>. Enklas t förklaras detta med utgångspunkt från mikrofonen med B-format rikt- ningsdiagram enligt figur 5. Den typen av mikrofon har

fig 5 B-formad riknings- karakteristik

membran

~d/

\

\

\ b

'" 1-

\ I

\

\ I

• a

fi g 6 Mikrofon med riktnings- karakteristik enl. fig 5

två ljUdöppningar, en på var sida av mikrofonen,se figur

6. Öppningarna leder t i l l var sin sida av membranet. Di- mensionerna hos anordningen skall vara så små att den

akustiska vägs.killnaden mellan öppningarna är en bråkdel

av våglängden för ljudet. Uppfylls inte detta kOYl1mer rikt-

(21)

21

ningskarakteristiken att avvika från det ideala.

De ljudvågor som infaller från tlsidan" ( a i fig 6 ) kom- mer att ge samma tryck på membranets båda sidor och där- med ingen utsignal. Ljudvågor som infaller från andra

riktningar ( tex b i fig 6 ) kommer att gå olika lång väg t i l l membranets båda sidor och ger därmed en tryck- gradient över membranet. Tryckgradienten sätter membranet i rörelse och ger därmed en utsignal.Mikrofonens känslig- het är störst i den riktning där vägskillnaden är störst, dvs i symmetrilinjen vinkelrätt mot membranet.

Genom att göra de två vägarna t i l l membranet olika kan man göra mikrofoner med andra riktningsegenskaper.

Kardiodmikrofonen har som framgår av namnet ett kardiod- format riktningsdiagram. Hur detta ser ut för en verklig mikrofon framgår av figur 7. Kar:iiodmikrofonen har ganska

... 110H,

180' 180' - - - SOOHt

- - - 1 0 0 0 H . - - - l 0 c 0 H t

- - - 4 0 0 0 » 1 ··· .... ·· .. ···'····8000 HI

fig 7 Riktningskarakteristik för kardiodmikrofon

stor känslighet

II

sne t t bakåt" och åt sidorna. Hos super-

kardiodmikrofonen har man gjort mikrofonen mindre känslig

(22)

. . . • . . . . . • . . . . 250 Hz 1800 180" 500Hz

1000Hz _...: ______ 2000Hz

________ 4000Hz .•.•••.•••.•. 8000Hz

fig 8 Riktningskarakteristik för superkardiodmikrofon

•..••••..••• ~ ... , ... 250Hz - - - - 1 0 0 0 H z ___ - _ - - 4000 Hz

1800

+--J---l----1 90 o

500 Hz ---2000Hz

•··•• .. ···8000 Hz

22

fig 9 Riktningskarakteristik för interferensriktmikrofon

(23)

åt sidorna och i stället accepterat en bilob bakåt. Ett exempel finns i figur 8.

23

För att göra mikrofoner med ännu större riktverkan utnytt- jar man ljudvågornas interferens. Man förser ett långsträckt mikrofonhölje med en lång rad ljudöppningar. Om det hela utformas på rätt sätt kommer man att få konstruktiv inter- ferens i en viss riktning~ där man alltså får ett känslig- hetsmaximmTI. För andra ljudriktningar kommer ljudvågorna t i l l de olika öppningarna att delvis upphäva varandra vid membranet. Om mikrofonen skall ge god riktverkan även för låga frekvenser, blir mikrofonen stor och ohanterlig.

I figur 9 visas riktningskarakteristiken för en sådan mikrofon. Mikrofonen är i detta fall 550 mm lång.

En i många sam~anhang irriterande nackdel hos tryckgra-

dientmikrofoner är den bashöjning som blir fallet när

mikrofonen placeras nära ljudkällan. Mikrofonen är konst-

ruerad för att ~e en rak frekvensgång för plana ljudfält

trots att den tryckgradient som därvid uppstår över memb-

ranet avtar med ökande våglängd hos ljudet. När mikrofonen

utsätts för ett sfäriskt ljudfält som ger upphov t i l l en

frekvensoberoende tryckgradient kowiler den därför att

'framhäva de lägre frekvenserna.

(24)

3.Lj. NÄRMIKROFONER AV TRYCKGRADIENT'PYP

Tryckgradientmikrofonens egenskap att vara känsligare för sfäriska ljudfält än för plana sådana kan utnyttjas för att undertrycka buller. Ljudfältet från munnen är nära den talande sfäriskt, medan bullerljudfältet snarare är plant. Avståndet t i l l bullerkällan är nämligen oftast större än avståndet t i l l talarens mun. En stor del av bul- lerljudet når vanligen mikrofonen reflekterat från omgivan- de föremål. Vågfrontens form blir därför svår att bestämma, men den är i alla händelser planare än talljudens vågfront.

Genom att dimensionera mikrofonen riktigt kan man få en mikrofon som, i större delen av det för talöverföring

nödvändiga området, ger en kraftig förstärkning för sfäriska ljudfält.

Frekvensgången för en sådan mikrofon beror på radien hos

ljudfältet, dvs avståndet t i l l ljudkällan. För vilket

avstånd man får "rakast

tl

frekvensgång beror naturligtvis

på tillverkarens intentioner, men det brukar röra sig om

några cm från ljudkällan. Vid talupptagning ska mikrofonen

således placeras mycket nära talarens mun. Skillnaden i

känslighet för sfäriska och plana ljudfält varierar med

frekvexlsen. Den är störst vid låga frekvenser, kanske

20 dB vid 100 Hz, för att avta mot ingen skillnad alls

vid några tusen Hz, detta för ett sfäriskt ljudfält med

ett par cm radieo

(25)

25 3.5 KONTAKffMIKROF'ONER

3.5.1 Princip.

Konventionella mikrofoner bygger på samma princip som det mänskliga örat. Ett membran sätts i rörelse av luftens

tryckvariationer.

I luften finns emellertid ljudvågor från alla ljudkällor i omgivningen. När ett ljud alstras brukar detta vara förknippat med ett föremåls vibrationer exempelvis en sträng hos ett musikinstrument. Ljud uppko®nna genom re- sonanser hos helt eller delvis inneslutna luftvolymer behöver inte vara förbundna med någon vibration hos ljud- strålaren. Ofta är denna emellertid inte helt styv, utan vibrerar i större eller mindre grad.

Om man nu kunde detektera vibrationerna direkt hos ljud- strålaren kunde man bli av med de störningar som härrör från andra ljudstrålare. Den enda möjligheten för dessa att störa är om de kan sätta den tilltänkta strålaren i vibration

Detta är tanken bakom kontaktmikrofonen.

3.5.2 Kontaktmikrofonanvändning för tal.

Talet härrör från ett flertal olika ljudkällor, represen- terande båda de ovan nämnda principerna. Grundtonen hos de tonande ljuden genereras av stämbanden. Det därvid genererade övertonsspektrumet !!filtreras

tf

genom det akus- tiska filter som bildas av de resterande delarna av tal- organet. De tonlösa ljuden däremot genereras som friktions~

ljud vid förträngning eller avböjning av utandningsluften.

Olika delar av talapparaten sätts under talet på skilda

sätt i vibration Det finns dock knappast någon punkt

vars vibrationsmönster på något enkelt sätt motsvarar

luftens ljudvågor för alla typer av talljud. Exempelvis

vibrerar larynx naturligtvis i takt med grundtonen. Dess

(26)

vibrationer ger däremot knappast n~gon information om de tonlösa ljuden. Inte heller f~r man n~gon klar bild av vilket tonande ljud det är fr~ga om. Informationen

26

om ansatsrörets form och därmed formanternas lägen tappas nämligen helt bort. (7)

Om man önskar använda kontaktmikrofon för talupptagning

m~ste man hitta n~gon plats p~ halsen eller huvudet där en kontaktmikrofon kan fästasi och vars vibrationsmöns- ter s~ mycket som möjligt liknar ljudv~gorna i luften.

vibrationerna p~ den utv~lda platsen ska inte vara en följd av de utfr~n kOlnmande ljudv~gorna, tex fr~n munnen, utan enbart av de ljudv~gor som transmitterats genom krop~

pens vävnader. Om nämligenikroppsdelen och därmed mikro- fonen sätts i vibration av ljudfältet fr~n munnen sa

kommer den att sättas i vibration även av andra ljudfält, tex buller.

Fr~gan om hur en kontaktmikrofon skall placeras är s~ledes

den första man m~ste undersöka om man vill använda den för upptagning av tal.

Frikativorna är brusljud som uppst~r vid den förbiström- mande utandningsluftens friktion mot förem~l i dess väg,

tex genom att luftkanalen trängs ihop. Ljudalstringen är inte direkt förbunden med vibration .hos n~gon del av talapparaten. Sekundärt kommer emellertid munh~lans och halsens vävnader att sättas i vibration .. Dessa vibratio- ner kommer att p~ olika sätt transmitteras till olika platser i ansiktet och p~ halsen. Härvid kommer de väv- nader som vibrationerna fortplantas genom att p~verka vibrationsmönstret genom sin frekvensberoende dämpning och sina eventuella resonanser. Situationen är ungefär den samma för klusilerna.

När det gäller de tonande ljuden är situationen ännu mer

komplicerad. Som tidigare nämnts "filtreras!! stämbands-

(27)

27

spektrum under sin passage genom ansatsröret. Härvid kom- mer ansatsrörets väggar att sättas i vibration av luft- trycket. Dessa viberationerkommer att ledas genom väv- naderna tilJ,. en eventuell kontaldmikrofon på huden. An- satsrörets resonanser skaper formanterna hos tall juden.

Ansatsrörets resonansmoder har emellertid sina maxima på olika ställen, jämför fig 10. Ansatsrörets väggar kommer

~ Fl

>

F2

fi~

10 Tryckfördelningen i en rak tub

därför att påverkas av olika ljudtryck på olika platser längs röret. Om man sätter kontaktmikrofonen någonstans nära ansatsrörets tryckmaximum för en viss resonansmoc,l kommer motsvarande formant att bli förstärkt i mikrofon- signalen. (Använt gäller det naturligtvis att placering i närheten av ett tryckminimum ger en försvagning av, eller helt upphäver motsvarande formant.

De olika resonansmodernas fördelning i ansatsröret har studerats av Gunnar Fant; (8,9,iO~~

, . l , .

. Figur 11, som är hämtad ur "Spatial characteristics of vocal tract resonance mode s" av Gunnar Fant och Stefan Pauli (10" åskådliggör detta för vokalen [~.

Om man exempelvis tänker sig en mikrofonplacering på hal- sen, ganska nära struphuvudet, skulle dett innebära att

F2 ochFL~ återgavs kraftigt, medan· F3 skulle återges,:

svagt, jämför mätningar på sid U4 iappendi::x;. p.örhållan-

dena kompliceras emellertid av ljudets ledning från olika

ställen på ansatsröret t i l l kontaktmikrofoneno

(28)

~

SG 10

VD\iEl

PRE YEL .6

~.

I-'G".L-O...,..=~L...-.r- RLÖ=r -0

fRGL LAG

BG 19 -SR 29

---SRG 48

fig 11

'R<;)sults are presentad in Figs. / ,with the notations VEL and PRE for velocity and prc:ssure, KIN and POT for kinetic and potential cnergy density, TOT for the den sit y of total reactive cnergy lON

+

POT, and LAG = lON - POT refcrred to as the "Lagrangian". Thc distribu- tion of frictionallosses is denoted RLO and of heat concluction los ses GLO and thc intcgrated vahles of these density functions the bandwidth componcnts BR and BG with the sum BRG '" BR

+

BG. Velocity and pres- sure scales have been normalized with respec! to thd1' individual absolute maximum valnes. The scales of KIN, POT, .TOT, and LAG have been normalized with respcct to the maximum of TOT whilst the scales of RLO, GLO, and RGL have beennormalized with respect to the RGL max- imum.

De olika resonansernas fördelning i ansatsröret för vokalen [il. Figuren är hämtad ur (10)

28

(29)

29

Ljudtransmissionen t i l l olika tänkbara mikrofonplaceringar är den avgörande faktorn när det gäller den resulterande ljudkvaleteten. Opublicerade undersökningsresultat av Jan Lindqvist-Gauffin tyder på att den lämpligaste trans- missionen sker i mjuka vävnader. Visserligen är dämpningen

i sådana vävnader stor, men de är i gengäld fria från resonanser. Benvävnaderna tycks däremot ge kraftiga reso-- nanser.

Förhållandena är så komplicerade att några teoretiskt underbyggda förslag t i l l placeringar knappast kan ges.

Man kan emellertid allmänt säga att placeringar på hal- sen bör framhäva tonande ljud, medan placeringar i ansik- tet bör ge bättre balans mellan tonande och tonlösa ljud.

I ansiktet finns det eventuellt risk för resonanser i ansiktets ben och håligheter.

I den mån man i dag använder kontaktmikrofon fBr tal pla-

cerar man den vanligen på halsen, i höjd med eller ovanför

larynx.

(30)

3.6 OMVANDLINGSPRINCIPER

3.6.1 Konventionella mikrofoner

I den konventionella mikrofonen gäller det att överföra luftens tryckförändringar t i l l en elektrisk signal. Luft-

trycket f~r D~verka ett membran, vars rörelser sedan om- vandlas t i l l elektriska signaler.

I den piezoelektriska mikrofonen utnyttjar man piezoe1ekt- riska kristaller som avger en laddningsmängd när man böjer eller sammanpressar dem. Om man förser kristallen med

två belägg kan man med en högohmig förstärkare ta ut en spänning mellan dessa belägg. Behovet av högobmig f'örstär- kare samt det faktum att mikrofonen är mekaniskt ganska

ömt~lig gör mikrofontypen mindre användbar.

I den dynamiska mikrofonen låter man en liten spole röra sig i fältet från en permanentmagnet. Utspänningen fr~n

spolen är d~ ett mått p~ hastigheten hos membranet. Dy- namiska mikrofoner spänner över en vid pris och kvalitets- skala.

I mycket krävande sammanhang användes kondensatormikro- foner. I en kondensatormikrofon utgör membranet den ena plattan i en kondensator. Om man l~ter kondensatorn lad- das upp t i l l en hög spänning genom ett stort seriemotst~nd

kommer den att vara signalmässigt isolerad och laddningen Q därmed konstant. Eftersom kondensatorns kapacitans va- rierar när membranet rör sig, f~r man enligt formeln

U =.9, C

en variation i spänningen U när kapacitansen C varierar.

Med en tillräckligt högohmig förstärkare kan denna varia- tion mätas utan att kretsens funktion störs. En annan princip användes i de så kallade HF-kondensatormikrofo~

ne:rna. Kondensatorn ingår där i svängningskretsen i en

högfrekvensoscillator. När kapacitansen varierar kommer

oscillatorns utsignal att bli FM-modulerad. I den efter-

(31)

följande FM-detektorn demoduleras signalen. En av förde- larna är a t t frekvensgånge:rt kan uts träckas godtyckligt

31

långt ned i frekvens. Nackdelen är den eventuella förvräng- ningen av signalen i högfrekvensomvandlingarna.

En elektretkondensatormikrofon är en kondensator~ikrofon

där man i stället för en hög polarIsations spänning över

kondensatorn har ett material i den med elektret-egenskaper.

Elektreten kan sägas vara den elektriska motsvarigheten t i l l permanentmagneten. Den upprätthåller ett konstant elektriskt fält. Elektretmikrofonerna kan göras både bil- liga och bra. De utgör en stark konkurrent t i l l de dyna- miska mikrofonerna. Möjligen kan man se behovet aven spän- ningskälla för matning av den inbyggda (FET)förstärkaren

som en nackdel. Effektbehovet är dock mycket litet.

3.6.2 Kontaktmikrofoner

I en kontaktmikrofon vill man överföra en vibration t i l l en elektrisk signal. I mättekniska sammanhang prukar anord- ningar för detta kallas accelerometrar. Som namnet antyder mäter man alltså egentligen accelerationen hos det före- mål eller den kroppsdel man fäst mikrofonen på. För att mäta accelerationen behöver man en elastiskt upphängd massa, vars rörelser relativt mikrofon-· (accelerometer-) höljet kan detekteras. Alla de principer som användes när det gäller konventionella mikrofoner skulle kunna utnyttjas för denna ~ö~else~etektering. Vanligen användes den piezoelektriska metoden. I detta fall kan man låta den piezoelektriska kristallen utgöra massan oc~ genom att fästa den i mikrofonhöljet i någon eller några punkter få den att böjas eller sammanpressas vid acceleration.

Beroende på hur kristallstycket utformas och fastsättes får mikrofonen olika egenskaper.

Låt oss betrakta en accelerometer meden massa inspänd

med f j äderkons tanten K (N/m) och dämpningen B (Ns/m).

(32)

32 Xi ärJJ.o,J .. ,iets koordinat i ett fast k00rdinatsystem. x

2 är massans koordinat i ett koordinatsystem som följer med accelerometerhöljet. Det är x 2 eller dess derivator vi kan överföra t i l l elektriska signaler. Den acceleration vi egentligen skulle vilja ha reda på är andraderivatan av Xl' ~l' För systemet gäller

För sinusformade rörelser gäller att överföringsfunktionen är

Detta är ett andra ordningen system med resonansvinkel- frekvensen !K/M och dämpningen 2 ~ •

För att x

2 skall utgöra ett mått på ~lJ måste man alltså hålla sig långt under W=!K/M. Av det sk1:ilet bör naturligt- vis K vara s tort och M litet. Vidare bör dämpningen vara någorlunda stor för att göra resonans toppen mindre utpräg- lad. Dessa krav leder emellertid t i l l att känsligheten hos systemet minskar. Detta är allvarligt eftersom de vibrationer som kontaktmikrofonen utsätts för är mycket

små. (Il)

Om man låter den piezoelktriska kristallen få formen av en stav inspänd i ena änden kommer fjäder'konstanten K och dämpningen B att få små värden. Därigenom blir käns- 1igheten stor. Tyvärr blir samtigt resonansfrekvensen lag och resonansen kraftig genom den låga dämpningen.

Om man i stället låter den piezoelektriska kristallen

få formen aven platta, fastspänd runt an, åstadkommer man

att K och B blir större, dvs resonansfrekvensen blir hög-

re och resonansen mindre utpräglad. Samtidigt sjunker

emellertid känsligheten.

(33)

33

När det gäller kontaktmikrofoner användes ytterligare en omvandlingsprincip, en princip som numera knappast kowner t i l l användning när det gäller konventionella mikrofoner, nämligen den magnetiska. I en sådan mikrofon har man en permanentmagnet som attraherar ett ankare (membran). Mel- lan de båda finns ett litet luftgap. När ankaret rör sig förändras reluktansen och därmed flödet i kretsen. Då induceras en spänning i en runt magneten placerad lind- ning. Att principen lever kvar när det gäller kontaktmik- rofoner kan bero dels på de måttliga kvalitetskrav man haft på dessa, dels på den höga utsignalnivån från mik- rofontypen. LjuCl.kvali teten är emellertid dålig. Som fram-

Magnetiska vibrations-pickuper

Vibrations-pickupen KM 401 i talfrekvensområdet används främst som strupmikrofon. Fyrkantig, med dimensionerna 7,15 x 10 x 4,2 är den synnerligen lämplig som inbyggnads-

omvandlare. Denna pick-up arbetar enligt den magne- tiska principen med en resonansfrekvens vid 1650 Hz.

Vibrationspick-upen MM 13-3 arbetar också enligt den magnetiska principen med en resonansfrekvens inom om- rådet 500 - 600Hz. Den används för speciella markljud- undersökningar och även för andra upptagningar, som har sina huvudkomponenter ungefär inom detta frekvensom- råde. Anpassningsimpedanser meddelas på förfrågan.

fig 12 Magnetisk kontaktmikrofon från Sennheiser

går av figur 12, som är hämtad ur en reklambroschyr från Sennheiser,.

är tex resonans- frekvensen låg.

Eftersom resonans- frekvensen bestämmer den högsta använd- bara frekvensen inser man vilka måttliga krav man kan ställa på en

sådan mikrofon.

(34)

3.7 MIKROFONERNA I UNDERSÖKNINGEN

I undersökningen ville man ha med några olika störnings- reducerande konventionella mikrofoner samt några kontakt- mikrofoner. Dessa skulle dessutom jämföras med den mik- rofon som normalt användes t i l l systemet. Även denna mik- rofon skulle alltså vara med i jämförelsen.

Dessutom har vid flera tillfällen olika typer av referens- mikrofoner använts i undersökningen. Alla dessa mikrofoner presenteras nedan mer eller mindre utförligt.

De jämförda mikrofonerna var:

Sennheiser MD421 som var den mikrofon som normalt använ- des t i l l igenkänningssystemet. Som framgår av figur 13 är det en dynamisk kardiodmikrofon med bra data (12).

Sennheiser headsetmikrofon är en dynamisk närmikrofon av tryckgradienttyp. Tillverkaren uppger att frekvensgången blir rak enlig fig 13 med mikrofonen placerad l cm från mungipan.

Tryckgradientmikrofonkapsel HOSIDEN KUC 7001. Mikrofon- kapseln är av elektrettyp. Frekvensgång enligt tillverkaren

samt dimensioner framgår av fig 14. Någon uppgift om vil- ket mikrofonavstånd som frekvensgången gäller för finns inte. För att använda kapseln som en komplett mikrofon anbringades den i en hållare och fästes i hörtelefon på

sa~na sätt som ovanstående mikrofon. Mikrofonen matades med likspänning från ett batteri.

Kontakbnikrofon med stavformad piezoelektrisk kristall.

Mikrofonen var tillverkad vid institutionen fBr talöver-

föring~ Dess dimensioner framgår av fig 15. Mikrofonens

data kommer att framgå ~v mätningarna i kap 5.

(35)

IE~EIfI ~ •

dl

20

*

Soll·Frequem:kurve 30 IS

Typ: MD421

20 1

Prijffeld

p'

!

25d&

I so

da

at:

X

I

Sign. <li\,. Dot: 14.2.74 '1'-

o 0lO 20 1

••••••••.•.••.•••••• 250 Hl 1000 Hl - ... ---4(lOOHl

.

5

- .-- -

'.-

-.

2C

35

- . . - - - - 2 o o o H l

••••••••••••••• .. • .. ·8000 Ht

- Il

. "'-

~-

-

5':00

~

2;lOO c.h

Normalfrekvensgång (med toleransfält) MO 421 Varje typ av denna mikro levereras med original mätprotokoll inorri området 40 - 17000 Hz.

Frekvensområde Akustisk princip Riktningskarakterist.ik

MO 421 III (Art. nr. 0342) MO 421 U-4 (Art. nr. 0984)

30-17000 Ht Tryckgradient Kardioid 18dB-2dB

MO 421-2 (Art. nr. 0331)

80-17 000 Hz Tryckgradient Kardioid 18 dB - 2 dB

MD 421 Hl. (Art. nr. 0339)

80-17000 Hz Tryckgradient Kardioid 18 dB - 2 dB

0,2 mV/l'bar ,t:= 2 mV/Pa ± 3 dB 0,2 mV/l'bar t:=:2 mV/Pa ± S dB 2,0 mV/"bar t:= 20 mV/Pa och' Riktningskänslighet vid 1800 och 1 kHz (utsläckning) .

Känslighet (obelastad) vid 1 kH~ •. '

Elektrisk

impeda~s ~id

1 kHz ;.-

Nominell avslutningsimpedans Tal-Musik·omkopplare Anslutningsdon Stiftanslutningar

Mikrofonanslu!ningskontakt

Magnetisk störfaktor vid 50 Hz Mått

Vikt

~~,~~":'!~~~ ;

;;;: 200 hl

omkoppl ingsbar i 5 lägen S-polig DIN·kontakt enligt DIN 41 524 Stift 1 och S _ mik. spole Stift 2 och hölje .... jord Cannon:

Stift 2 och 3 ... mik. spole Stift 1 och hölje ... jord S-polig förskruvbar DIN·k"ntakt enligt DIN 41524 t. ex. T 3261/1 (liten tuchel) respektive trepolig Cannon kontakt XLR-3-11 C

;;;; 5 "V/5 " Tesla MD 421 N: 203 x 46 x 49 mm MD 421 U·4: 215 x 46 x 49 mm ca 530 g

Rätt \iI( ändringar p. g. a. tekniska framsteg förbehålles tillverkaren.

200 hl

;;O; 200 Q

3·polig DIN·kontakt enligt DIN 41 624 Stift 1 och 2...,. mik. spole Stift 3 och hölje .... jord

. O,2mV/"bar 4 :2 mV/Pa

±

3 dB 24 000 ~'och 200 bl

,;;;: 0,1 MQ el.;;;: 20()Q omkopplingsbar i 5 läge"

3-polig DIN-kontakt

• enligt DIN 41 524 Stift 1 och 2 nögohmig Stift 3 och 2 lågohmig Kontakthölje ... jord

3·polig förskruvbar DIN·kontakt 3·polig förskruvbar DIN·kontakt enligt DIN 41624 t. ex. T 3080/2 enligt DIN 41524 t. ex. T 3261/1 (stor tuchel)

;;;; 5 IIV/5 ~Tesla 191 x 46 x 49 mm

ca,500 g

;;;; 5 "VIG" Tesla 203 x 45 x 49 mm

ca 530 g

fig 13 Fabrikantdata för Sennheiser MD 421

(36)

MikrofonIhörtelefon- kombination HMD 414

I denna kombination ingår en utomordentligt liten och lätt dynamisk mikrofon, i vilken man för första gången har kunnat förverkliga ett ovanligt högt störavstånd och en överföringskvalitet som möjliggör fulländade radio- och TV-reportage vid svåraste förhållanden. De detaljer i konstruktionen som har lett till de utmärkta överföringsegenskaperna har patentsökts. Mikrofo- nens kombination med den ytterst pålitliga öppna stereohörluren HD 414 utgör ideallösningen för ett hör/tal garnityr. Vid svåra ljudförhållanden, t. ex. tu- multliknande publikovationer, ger HMD 414 en klart uppfattbar överföring.

Detta har visat sig speciellt vid kommentarer av idrottsevenemang på fotbollsarenor, där konventio- nella hör/tal-kombinationer inte fungerade p. g. a. den höga ljudnivån och de svårartade överföringsförhål- landena.

Det lätta, stabila och behagliga hör/tal-garnityret HMD 414 levereras för allmän användning, t. ex. til!

språklaboratorier, med fria kabe ländar.

Mikrofon/hör-kombinationen HMD 414-1 är konstrue- radför direkt anslutning till de kommentatorenheter som används av "Radio och TV, varvid fram- och åter- ledningen hos de båda hörsyslemen är anslutna sepa- rat till ett fempoligt uttag T 3360-1 och mikrofonen till ett trepoligt uttag T

3261~i.

Tekniska data

Mikrofon:

Frekvensomr1.de . • . . . • • • • • Akustisk arbetsprincip . , . . . .

Riktningskarakteristik , ,

Riktningsmätning vid 1200 odi"'1000 Hz (utsläckning) . Känslighet i fritt fält vid 1000 Hz ,

Elektrisk impedans vid 1000 Hz Magnetisk störfaktar vid 50 Hz Kontaktdon

HMD 414 (Art, nr, 0952)

50·- 12000 Hz

tryckgradientmikrofon för korta talavstånd superkardioid

20 dB - 2 dB

0,1 n1V//lbar ± 3 dB g 1 mV/Pa ± 3 dB 200 Q

1 /lV/50 mG f' 1 I"V/5I"T fria'kabeländar

HMD 414.1 (Art, nr, 952)

50 -12000 Hz

tryckgradientmikrofon för korta talavstånd superkardioid

20 dB - 2 dB

0,1 mVf!,bar

±

3 dB g 1 mV/Pa

±

3 dB 200 Q

1 /lV/50 mG g 1 I"V/5I"T

3-polig förskruvbar normerad kontakt, T 3261 001

fig 14 Fabrikantdata för Sennheiser headsetmikrofon

(37)

j

L

"

.Q

:~

~j

$

~..:..I ,.

L

r

l'·

. t 1.

o j

:::J '

l'?; .t

... F

,

"

;::)~ft

i~;}.

'L_ ..

.' ,

...

'.c::.i ~

't"""-

i U · , ::;:,i:,

!:(,.

1\

"'

"'

fig

--\\1

J l

O O o'

O O 0\

~---_._---;

...

~

37

14 Frekvensgång enligt

tillverkaren samt

mått för HOSIDEN

KUC 7001

(38)

6

fig 15 Dimensioner f~r kontaktmikrofonen med piezoelekt- risk stav.

Kontaktmikrofon med piezoe1ektr'isk platta, f~r ~vrigt

som den andra kontaktmikrofonen. Mikrofonen utgick p~

ett tidigt stadium av

unders~kningen

sedan den visat sig felaktig. Den var även här den fungerade som bäst knappast användbar p~ grund av sin l~ga känslighet.

Referensmikrofoner:

BrUe1 & Kjaer kondensatormikrofonkapsel 4133 med katod- f~ljaro 26l5.Mikrofonkombination med extremt goda data.

Sennheiser MD 211, rundkännande dynamisk mikrofon med

mycket ~oda data, vilket framg~r av fig 16.

(39)

Studiomikrofon MD 211 N

Denna dynamiska mikrofon lämpar sig utmärkt över- allt där man behöver en liten, lätthanterlig och diskret mikrofon och samtidigt kräver hÖgsta kvalitet. Den används utomhus av radio och TV, i mellanstora rum och vid överföring av konserter.

Denna mikrofon är absolut driftsäker och okänslig mot beröringsljud. För inspelningar utomhus rekommen- deras ett vindskydd, här som för alla mikrofoner.

Membranet i denna lilla mikrofon är praktiskt taget oförstörbart. För talåtergivning kan denna mikrofon t. o. m. belastas med en talväxelspänning av 2 V, vilket åstadkommer en klar och tydlig återgivning.

5

SE~lEn ~

d • d

*

Soll-Frequenzkurve 301 5

Typ:

MD211N 2 o l

Priiffeld

p 125dSI50d8 ot:

l I X

10 s

Sign. ~. Dot:11.2.72

1-.

010 20 o l

39

Som tryckmottagare har MD 211 N kulkarakteristik.

Mätprotokollet, som visar frekvensgången hos den i ekofritt rum testade mikrofonen, är beviset för att maximala avvikelser av endast ± 2,5 db tillåts inom området mellan 40 och 17000 Hz. Fackmän anser denna mikrofon som den minsta dynamiska studio- mikrofonen på den internationella marknaden. Vid en jämförande test som utfördes aven stor amerikansk facktidskrift har MD 211 N bedömts som bästa dyna- miska mikrofon.

Anslutningsteknik:

MD 211 N är kopplad lågohmigt enligt vårt schema N (se sid. 6). Även MD 211 U är lågohmig och har en Cannonkontakt XLR-3.

Utförande:

Båda mikrofonerna har en satinförnicklad metallkåpa.

I leveransen inaår en snabb-bytesklämma med

3/8 "

inre gänga.

il -

-

- . -

-

I- - I-

_.- - --

5 l 'OJ() sooa I )Q() 2~'

Normalfrekvensgång (med toleransfäH) MD 211 N - Varje typ av denna mkir. levereras med original mätprotokoll inom området 40 - 18000 Hz.

Tekniska data

Frekvensområde • • .

Akustik arbetsprincip . • . • . . Riktningskarakteristik • . . • • • . Känslighet i fritt fält obelastad vid 1 kHz •

Elektrisk impedans vid 1 kHz . Nominell avslutningsimpedans Anslutningsdon

Stiftanslutningar Ans!utningsdon

Störfaktor i magnetiskt fält vid 50 Hz

Mått • • • . . . • . . •

Vikt

Rätt till ändringar p. g. a. tekniska framsteg förbehålles tillverkaren.

MO 211 N (Art. nr. 0293) MO 211 U

30-20000 Hi 30-20000 Hz

Tryckmikrofon Tryckmikrofon

I det närmaste kulformad I det närmaste kur/ormad 0,13 mVh,bar ~ 1,3 mV/Pa 0,13 mV/;,bar ~ 1,3 mV/Pa

± 2,5 dB ± 2,5 dB

200 Q 200 Q

;;;;200Q ;;;;2ooQ

3-polig kontakt enligt DIN 41524 S-polig Cannon XLR-3 Stift 1 och 3 -> mik. spole Stift 2 och 3 -+ mik. spole Stift 2 och hölje -> jord Stift 1 och hölje -+ jord 3-polig förskruvbar kontakt S-polig Cannon XLR-3-11 C enligt DIN 41524 t. ex.

r

3261/1

40 iJ.Vl5

,l

Tesla -

22 mm (/), 120 mm lång ca 125 g

40 iJ.V!5 I-' Tesla 22 mm (/), längd 123 mm ca 125 g

fig 16 Fabrikantdata för Sennheiser MD 211

(40)

4 FÖRSÖKSUPPLÄGGNING

4.1 INLEDNING

Undersökningen av mikrofonernas egenskaper för automatisk taligenkänning kan sägas vara uppdelad i tre delmoment.

Den första delen av undersökningen är en uppmätning enligt välkända mätmetoder av de olika mikrofonernas egenskaper,

såsorn .frekvensgång och riktningsegenskaper.

Andra delen är en undersökning av de olika mikrofonernas sätt att återge tal. Uppmätningarna i första delen av undersökningen ger nämligen, särskilt när det gäller kon- taktmikrofoner och närmikrofoner, inte någon fullständig bild av detta. Spektrogram över de enskilda talljuden samt medelspektrum över längre textavsnitt används för att göra denna fullständigare.

Det tredje momentet är en undersökning av på vilket sätt mikrofonernas egenskaper påverkar taligenkänningen.

4.2 FREKVENSGÄNG, RIKTNINGSEGENSKAPER OCH AVSTÄNDSDÄMPNING

4.2.1 Teoretiskt

Frekvensgången är naturligtvis av avgörande betydelse för talåtergivningen. Eftersom alla de konventionella mikrofonerna i undersökningen är av differentialtyp kom- mer frekvensgången för dem att bero på radien hos ljud- vågornff'och därmed på avs tåndet t i l l ljudkällan. Frekvens- gången bör därför uppmätas för flera olika avstånd.

Riktningsegenskaperna kan åskådliggöras på flera olika

sätt. Antingen registrerar man utsp~inningen som funktion

av infallsvinkeln för ett antal diskreta frekvenser,

(41)

eller också utspänningen som funktion av frekvensen för några olika infallsvinklar. Den senare möjligheten passar bättre i vårt fall då man lättare kan utläsa tex hur bakåt- dämpningen varierar med frekvensen.

Dämpningen av plana ljudfält finns det inget vedertaget sätt att mäta. En tänkbar metod är den som valts i under-

~öknIngen, nämligen att jämföra utspänningen från mIkro- fonen för två olika ljudfält med samma ljudtryck, ett plant och ett sfäriskt. Det plana ljudfältet har approxi- merats med ett sfäriskt med flera meters radie. Om man väljer det sfäriska ljudfältets radie ungefär lika stor som radien i ljudfältet från munnen vid talupptagning, kommer man att få ett värde som ungefär motsvarar den bakgrunds dämpnIng man har vid användning av mikrofonen för talupptagning.

När det gäller kontaktmikrofonerna är det endast frekvens- gången som låter sig mätas.

4.2.2 Praktiskt

Frekvensgången för de konventionella mikrofonerna har uppmätts 1 det ekofria mätrum som disponeras av inst.

för talöverföring. Ljudkällan var för fjärrfältsmätningar- na en 10 tums mäthögtalare. Signalkällan var en Bruel &

Kjaer tongenerator (Beat Frequency Oscillator 1014 ).

Ljudtrycket hölls konstant i det frekvens område det med hänsyn t i l l högtalarens prestanda var möjligt. Konstant- hållningen åstadkoms genom att en BrUel & Kjaer

mätmil-cröfon ( 4133 / 2615 ) placerats invid den undersökta mikrofonen. UtspännIngen från mätmikrofonen förstärktes

i en BrUe1 & Kjaer mätförstärkare ( Microphone A.mp1ifier 2603 ) och användes sedan för att reglera utspänningen från tongeneratorn. För varje uppmätt frekvenskurva har noterats inom vilket frekvensområde ljudtrycket var kons-

tant. Utspänningen från den uppmätta mikfofonen har för-

stärkts i en FET-bestyckad förförstärkare med goda data.

(42)

1---

I EI-<ofritt rurn I

I I

I

I , I

I rnöthögt.!konstmun I

I ~ FET-

l mötobj. / fo" rst.

1 ' - ' 4133

I

I ,

I '

I

I 2615

I I

I

1..- _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ . _ _ _ _ _ _ _ _ _ _ _

I

1014 2603

/

2305

/

2113

L

fig 17 Mätuppkopplingen

(43)

Denna förstärkare var placerad inne i mätru:m.Yf1et. Signalen gick därefter t i l l en BrUel & Kjaer mätförstärkare ( Au- dio Frequency Spectrometer 2113 ). Utspänningen från denna förstärkare registrerades på en BrUel & Kjaer nivåskrivare ( Level Recorder 2305 ), vars pappersframmatning var synk- roniserad med generatorns frekvenssvep.

Genom att placera den första förstärkaren för

mikrofon~

signalen inne i mätrummet kunde signalnivån på förbindelsen ut från rummet hållas relativt hög. på detta sätt bemäst- rades de problem med överhörning och brum som fanns för dessa förbindelser. För att reducera inverkan av brus utanför det hörbara området lågpassfiltrerades mikrofon- signalen i B&K-förstärkaren vid 22 kHz} FET-förstärkaren gav nämligen en hel del högfrekvent brus.

Hela mätuppkopplingen finns skisserad i figur 17.

Uppmtitnlngen av frekvensgången för avlägsen ljudkälla gjor- des på 2 m avs t~md från högtalaren. Ljudtrycket kunde hållas konstant i området 30 - 10000 Hz, bortsett från

en resonans mellan 6000 och 7000 Hz. För att undersöka mikrofonernas rIktningsegenskaper togs denna kurva upp dels med mikrofonen riktad mot ljudkällan, dels 90 0 och 180 0 från den, se figur 18. Alla tre kurvorna togs upp

----I~((ttJ-

fig 18 Infallsvinklarna

på samma papper och med samma känslighet. Avståndet mellan kurvorna ger således

direkt dämpningen i den aktuella riktningen och frekvensen. SignalnIvån var l vIssa fall så låg att signalen helt dränktes i brus. Detta omöjlIggör tex några exakta angivel- ser av bakåtdämpningen för HOSIDEN-mlkrofonen.

Att signalnIvån var så låg

References

Related documents

Den 22 maj 2017 beslutade Landstingsstyrelsens arbetsutskott att ge nämnderna i uppdrag att inkomma med yttrande över landstingets föreslagna patientsäkerhetspolicy och att

tillräckligt med kunskap om hedersmord får sina föreställningar genom media, vilket innebär att detta är anledningen till varför medias framställning av dessa två fall

Regelrådet har inte funnit några skäl till att ifrågasätta förslagsställarens bedömning och finner att beskrivningen av om särskilda hänsyn behöver tas till tidpunkt

Finns det olika möjliga/tillåtna metoder som kan användas för att bedöma verkligt värde av förvaltningsfastigheter. Vilka värderingsmetoder används idag för att bedöma

KLYS yttrade sig i juni 2018 över utredningen SOU 2018:6 Grovt upphovsrättsbrott och grovt varumärkesbrott och ställde oss i princip positiva till utredningens förslag. Vi tillstyrker

Vi ser positivt på att utredningen i lagrådsremissen uppdaterat kvalifikationsgrunderna så att dessa blir mer dynamiska och bättre träffar sådan intrångsgörande verksamhet som sker

Det förekommer idag sajter för spridning av olika slags piratkopierat material och produkter, inte bara kopior av kläder utan även till exempel smink med farliga

TU konstaterade att här fanns uppenbara konflikter i förhållande till tryckfrihetsförordningen (TF) och yttrandefrihetsgrundlagen (YGL) eftersom ett beslag av ett domännamn inte