• No results found

Passive acoustic diver detection

N/A
N/A
Protected

Academic year: 2022

Share "Passive acoustic diver detection"

Copied!
24
0
0

Loading.... (view fulltext now)

Full text

(1)

12 045 augusti

Examensarbete 15 hp September 2012

Passive acoustic diver detection

Martin Olausson Fredrik Wiström

Aleksander Eriksson Borovicanin

(2)

Teknisk- naturvetenskaplig fakultet UTH-enheten

Besöksadress:

Ångströmlaboratoriet Lägerhyddsvägen 1 Hus 4, Plan 0

Postadress:

Box 536 751 21 Uppsala

Telefon:

018 – 471 30 03

Telefax:

018 – 471 30 00

Hemsida:

http://www.teknat.uu.se/student

Abstract

Passiv akustisk detektering av dykare Passive acoustic diver detection

Martin Olausson, Fredrik Wiström & Aleksander Eriksson Borovicanin

This report discusses a method to detect divers in harbour environments using passive acoustic detection. The goal was to achieve as high detection as possible without having too high false alarm rate. A short execution time was also desirable.

By using the characteristic of an inhalation a band-pass filter was applied to the signal to improve the signal to noise ratio. After the filtering an energy estimation of the signal was made. This energy estimation was later used in a frequency analysis, which could tell us if there were enough energy in the frequencies that correspond to a divers breathing frequency. If this energy exceeds a threshold the detector decides that there is a diver in the water. To get an acceptable amount of false alarms, the threshold was set so that the energy of the breathing frequencies had to exceed 5% of the energy in the frequencies above the breathing frequencies. Using this method on our data we found that the detector succeeded in finding the diver and didn’t give us any false alarms.

Ämnesgranskare: Johan Forsgren

Handledare: Magnus Lundberg Nordenvaad

(3)

Sammanfattning

I denna rapport presenteras en metod f¨or att detektera en dykare i hamnmilj¨o genom anv¨andande av ljudinspelningar fr˚an en hydrofon. Att kunna detekte- ra dykare i hamnomr˚aden ¨ar ¨onskv¨art d˚a de kan utg¨ora ett hot mot s¨akerhet dels p˚a grund av terrorism, men ¨aven p˚a grund av spionage. Med hj¨alp av en dator och MATLAB behandlas och analyseras ljudet. Dessa ber¨akningar tar h¨ansyn till karakt¨arstiken hos ljudet som dykaren ger upphov till, samt hur bakgrundsbruset beter sig. Av det ljud som dykaren ger upphov till ¨ar det framf¨orallt ljudet av en inandning som ¨ar l¨ampat f¨or detektion. Detta eftersom det ¨ar inandningen som skiljer sig mest fr˚an bakgrundsbruset. ¨Aven att inandningen ¨ar ett cykliskt ˚aterkommande ljud utnyttjas. Denna metod m¨ojligg¨or bra detektion utan att f¨or den delen ge en stor del falsklarm. ¨Aven exekveringstiden f¨or metoden ¨ar godtagbar vilket g¨or det m¨ojligt att anv¨anda metoden operativt.

(4)

Inneh˚ all

1 Inledning 3

2 Metod 5

3 Utv¨ardering och diskussion 12

4 Slutsats 17

5 Referenser 17

6 Appendix 18

(5)

1 Inledning

Hamnomr˚aden ¨ar en viktig knutpunkt f¨or s˚av¨al internationell handel som f¨or resande och turism. Av dessa sk¨al kan de utg¨ora m˚al f¨or terroristverksamhet.

Aven industriellt och milit¨¨ art spionage kan f¨orekomma i hamnomr˚aden. Det

¨ar d¨arf¨or viktigt att kunna garantera s¨akerheten i dessa omr˚aden och en del av detta ¨ar att kunna uppt¨acka obeh¨origa dykare. Det klassiska s¨attet att detektera dykare och andra objekt under vatten ¨ar att anv¨anda sig av aktiv sonar, vilket g¨ors genom att man s¨ander ut en signal och analyserar reflektio- nen. Med aktiv sonar kan det dock vara v¨aldigt sv˚art att uppt¨acka en dykare i n¨arheten av till exempel ett fartyg, eftersom att dykarens reflektion kommer vara v¨aldigt svag i f¨orh˚allande till reflektionen fr˚an fartyget. F¨or att komma runt det ovan n¨amnda problemet kan s˚a kallad passiv akustisk detektering anv¨andas. Passiv akustisk detektering g˚ar ut p˚a att analysera det ljud som dykaren sj¨alv ger upphov till. Problemet som uppst˚ar ist¨allet ¨ar att man inte vet exakt vad f¨or signal man letar efter, d˚a ljudet fr˚an en dykare beror p˚a en m¨angd olika faktorer.

En ytterligare f¨ordel med passiv detektering ¨ar att man sj¨alv inte beh¨over s¨anda ut en signal och p˚a s˚a s¨att beh¨over man inte avsl¨oja sig sj¨alv f¨or att detektera andra. Passiva detektionsmetoder ¨ar d¨arf¨or mycket attraktiva in- om framf¨orallt milit¨ara applikationer d˚a f¨orm˚agan att sj¨alv f¨orbli ouppt¨ackt

¨ar ¨onskv¨ard.

Syftet med v˚art projekt var att utveckla en passiv akustisk detektionsme- tod som utifr˚an en inspelad ljudupptagning ska kunna avg¨ora huruvida en dykare ¨ar n¨arvarande eller ej. Ljudet som en dykare ger upphov till kan va- riera beroende p˚a en m¨angd faktorer, och l¨ampar sig olika v¨al f¨or detektion.

Det ljud som l¨ampar sig b¨ast f¨or detektion ¨ar ljudet fr˚an andningen eftersom en dykare alltid andas och ljudet har en tydlig karakt¨ar med viktiga likheter fr˚an dykare till dykare. I fallet med ett ¨oppet andningssystem utg¨ors utand- ningen av bubblor, vilket ¨ar en l˚agfrekvent och relativt svag signal. Ljudet av inandning h¨arr¨or fr˚an munstycket och har ett brett frekvensspektrum med h¨og centerfrekvens. Vidare kan man utnyttja att en dykares andning ¨ar en cykliskt ˚aterkommande signal genom att g¨ora en periodicitetsanalys. Pro- blem med detta ¨ar att periodtiden kan variera v¨asentligt fr˚an individ till individ, men ¨aven stora oregelbundenheter mellan enskilda andningcykler kan f¨orekomma. Normal andningsrytm b¨or ligga mellan 0,1 och 0,5 Hz.

Signalbehandling i marina milj¨oer ¨ar i regel sv˚art d˚a vattnets egenskaper kan variera kraftigt i b˚ade rum och tid vilket leder till att ¨aven ljudutbred-

(6)

ningen varierar i b˚ade rum och tid. Ljud utbreder sig snabbt i vatten och ekon klingar kvar l¨ange. I hamnomr˚aden r˚ader det ¨aven mycket aktivitet s˚a bakgrundsbruset ¨ar starkt och kan variera kraftigt. Bruset kan utg¨oras av b˚atmotorer som startar, skrovarbeten och annat hamnrelaterat buller. Fr˚an en framtagen uppskattning av brusets utbredning i frekvensdom¨an, se Fi- gur 1, kan man se att bruset ¨ar som starkast f¨or l˚aga frekvenser, f¨or att sedan avta mot en mer konstant niv˚a f¨or h¨oga frekvenser. Detta leder till att utandningen tenderar att f¨orsvinna bland bruset. D¨aremot skiljer sig inand- ningen fr˚an bruset t¨amligen mycket, vilket medf¨or att det ¨ar inandningen som efters¨oks f¨or detektion.

Figur 1: Spektrum ¨over bakgrundsbrus i hamnmilj¨o.

Onskv¨¨ arda egenskaper p˚a programmet ¨ar att man skall ha CFAR, Constant False Alarm Rate. Detta inneb¨ar att man vill ha en konstant falsklarmsniv˚a, PF A. Falsklarmsniv˚an skall allts˚a vara oberoende av styrkan p˚a bruset. Man vill ¨aven ha en rimlig PF A f¨or att systemet ska vara m¨ojligt att anv¨anda i praktiken. F¨or denna falsklarmsniv˚a vill man ˚astadkomma s˚a god detektion som m¨ojligt. Faktorer att ta h¨ansyn till ¨ar starkt varierande brus och otyd- lig andning. Vidare vill man ha relativt kort exekveringstid f¨or att systemet skall kunna anv¨andas operativt; om metoden blir f¨or kr¨avande kommer den

(7)

inte att kunna k¨oras i realtid och systemet blir oanv¨andbart eller allt f¨or prestandakr¨avande.

2 Metod

Till v˚art f¨orfogande hade vi erh˚allit tre ljudinspelningar fr˚an FOI. Dessa ljud- inspelningar var inspelade vid FOI:s testanl¨aggning i Stockholms sk¨arg˚ard med en samplingsfrekvens p˚a 192 kHz. Tv˚a av ljudinspelningarna, vardera ca sju minuter l˚anga, hade en dykare n¨arvarande medan den tredje inspel- ningen, som var cirka tio minuter l˚ang, enbart inneh¨oll brus. En av ljudfilerna med en dykare n¨arvarande anv¨andes f¨or utveckling av metoden medan den andra l¨amnats ˚at utv¨ardering.

Inom detektionsteori utg¨ors problemet ofta av att avg¨ora mellan tv˚a oli- ka fall, att en signal utg¨ors av endast brus eller att den utg¨ors av brus och en s¨okt signal.

H0 : x[n] = w[n] n = 0, 1, . . . , N − 1

H1 : x[n] = w[n] + s[n] n = 0, 1, . . . , N − 1 (1) I Ekvation (1) betecknar H0 den s˚a kallade nollhypotesen, det vill s¨aga att den uppm¨atta signalen x[n] enbart best˚ar av bakgrundsbrus w[n]. H1 be- tecknar den alternativa hypotesen, d¨ar antas att den uppm¨atta signalen x[n]

best˚ar av brus, w[n], samt en efters¨okt signal s[n]. I detta fall ¨ar s[n] inand- ningarna fr˚an dykaren. Metoder f¨or att avg¨ora mellan dessa tv˚a fall kallas hypotespr¨ovning [1]. Vid hypotespr¨ovningen kan det uppst˚a tv˚a typer av fel.

Dels kan man besluta H1 trots att H0 g¨aller, detta ¨ar ett typ 1 fel, eller med andra ord ett falsklarm. Man kan ¨aven f˚a typ 2 fel som inneb¨ar att man beslutar H0 trots att H1 g¨aller, allts˚a en missad detektion.

Vid hypotespr¨ovning inom detektionsteori finns olika metoder att f¨or att uppn˚a ¨onskade egenskaper hos detektorn. En Neyman-Pearsondetektor [2],

L(x) = p(x; H1)

p(x; H0) > γ x = [x[0], x[1], . . . , x[N − 1]]T,

d¨ar p(x; H0) och p(x; H1) betecknar t¨athetsfunktionerna f¨or x givet H0 re- spektive H1, minimerar risken f¨or missad detektion f¨or en given sannolikhet f¨or falsklarm. Neyman-Pearsondetektorn beslutar H1 om likelihoodkvoten L(x) ¨ar st¨orre ¨an tr¨oskeln γ. F¨or att kunna anv¨anda sig av denna detektor kr¨avs k¨annedom om f¨ordelningen av x under b˚ada hypoteserna. H¨ar uppst˚ar

(8)

ett problem; den av dykaren genererade signalen s[n] kan inte antas vara helt k¨and eftersom andningars utseende och periodicitet varierar mycket mellan individer och dessutom f¨or¨andras i tiden. Detta f¨orsv˚arar analysen avsev¨art.

Ett s¨att att ta sig runt dessa sv˚arigheter ¨ar att man ist¨allet f¨or att analysera en l¨angre andningsf¨oljd ist¨allet inriktar sig p˚a att detektera en enskild inand- ning. Det ¨ar d˚a l¨attare att g¨ora en n˚agorlunda r¨attvisande approximation av signalen. Om man antar att bruset ¨ar gaussiskt f¨ordelat med k¨and varians σ2 och v¨antev¨arde 0 och att ¨aven inandningsignalen ¨ar gaussiskt f¨ordelad med varians σs2 och v¨antev¨arde 0 erh˚alls att x ∼ N (0, σ2I) under H0 och att x ∼ N (0, (σ2+ σs2)I) under H1. Detta medf¨or att likelihoodkvoten L(x) ges av

L(x) =

1

[2π(σ2s2)]N/2e

1 2(σ2s +σ2)

PN −1 n=0x2[n]

1 [2π(σ2)]N/2e

1 2(σ2)

PN −1

n=0 x2[n] .

Genom att logaritmera likelihoodkvoten erh˚alls log-likelihoodkvoten,

l(x) = N 2 ln

 σ2 σs2+ σ2

 + 1

2

σ2 σ22s+ σ2)

N −1

X

n=0

x2[n].

Fr˚an log-likelihoodkvoten erh˚alls att H1 beslutas om

T (x) =

N −1

X

n=0

x2[n] > γ0. (2)

Med andra ord ber¨aknar man energin i en uppm¨att signal och j¨amf¨or den mot en tr¨oskel γ0. Sannolikheterna f¨or falsklarm samt detektion kan ber¨aknas eftersom

T (x)

σ2 ∼ χ2N givet H0

T (x)

σs22 ∼ χ2N givet H1 . (3) Allts˚a f˚as andelen falsklarm samt detektionssannolikheten, PD, av

PF A = Qχ2

N

γ0 σ2

 PD = Qχ2

N

 γ0 σs22

 .

Med hj¨alp av k¨annedomen om f¨ordelningen av T (x) fr˚an Ekvation (3) kan Ekvation (2) illustreras i Figur 2.

Vid andv¨andandet av den h¨ar metoden antas σ2 vara k¨and. S˚a ¨ar det inte i det verkliga fallet, utan den kan variera kraftigt. Man kan emellertid g¨ora en god approximation av σ2 genom att uppskatta den i intilliggande omr˚aden

(9)

Figur 2: Beslutsomr˚aden f¨or hypotestest. Vid energi st¨orre ¨an γ0 beslutas H1. i signalen. F¨or att kunna g¨ora denna approximation antas att intilliggande omr˚aden enbart inneh˚aller brus. Detta antagande ¨ar givetvis ofta felaktigt.

Det som sker om de intilliggande omr˚adena skulle inneh˚alla b˚ade brus och andning ¨ar att approximation av σ2 blir f¨or stor. Detta i sig medf¨or att tr¨oskeln γ0 blir st¨orre som g¨or att kraven f¨or detektion blir h¨ogre. Omr˚adena som unders¨oks f¨or detektion av andning v¨aljs s˚aledes s˚a att om n˚agot av de intilliggande omr˚adena inneh˚aller andning ska inte det unders¨okta omr˚adet

¨aven det kunna inneh˚alla andning. Ur Figur 3 framg˚ar det hur tr¨oskeln γ0 och v¨ardet av T (x) varierar beroende p˚a hur signalen ser ut.

Med ovan n¨amnda metod kan man detektera en enskild andning, dock r¨acker inte det f¨or att man ska besluta om att det ¨ar en dykare n¨arvarande. Man skulle d˚a f˚a alldeles f¨or h¨og falsklarmsniv˚a till f¨oljd av att bruset skulle kun- na likna en enskild andning. Anv¨andande av en Neyman-Pearson detektor baserat p˚a en enskild andning ¨ar i sig allts˚a inte tillr¨ackligt f¨or detektion, men skulle tillsammans med en periodicitetsanalys eventuellt leda till att man ¨aven lyckas detektera fall med mer oregelbunden andningsperiodicitet.

Det fr¨amsta problemet med den h¨ar metoden som i slut¨andan ledde till att den f¨orkastades var att modelleringen av andningen och bruset inte st¨amde

(10)

Figur 3: Programk¨orning med en Neyman-Pearson andningsdetektor. I (a) kan ett spektrogram ¨over ljudsignalen ses. I (b) plottas tr¨oskeln γ‘ och T(x).

tillr¨ackligt v¨al ¨overens med verkligheten. Bakgrundsbruset ¨ar i sj¨alva verket f¨argat (se Figur 1) och inte tillr¨ackligt likt v˚ar approximation av vitt brus.

Detta f˚ar f¨oljden att man f˚ar en felaktig falsklarmsniv˚a och metoden blir v¨aldigt sv˚aranv¨and. Flera f¨ors¨ok att genom filtrering g¨ora bruset approx- imativt vitt (se Appendix A: Prewhitening) genomf¨ordes med varierande framg˚ang. Dessutom kr¨aver denna modell h¨ogt SNR, Signal to Noise Ratio.

F¨or att b¨attre kunna detektera dykare m˚aste man ta h¨ansyn till periodicite- ten i andningarna d˚a detta v¨asentligt minskar kravet p˚a god SNR. F¨or att g¨ora det anv¨ands ist¨allet metoden som illustreras i Figur 4.

Figur 4: Ett blockdiagram som illustrerar modellen.

(11)

F¨or att framh¨ava andningarna tydligare fr˚an bruset filtrerades signalen. Uti- fr˚an k¨annedom om brusets samt en andnings utseende i frekvensdom¨an kon- struerades ett bandpassfilter. Bandpassfiltret konstruerades s˚a att det sl¨apper igenom frekvenser mellan 20 och 65 kHz utan st¨orre inverkan, eftersom att det ¨ar d¨ar som andningsignalen ¨ar som starkast. Frekvenser under 15 kHz d¨ampas kraftigt eftersom att bruset ¨ar som energit¨atast vid l˚aga frekvenser.

Frekvenser ¨over 70 kHz d¨ampas inte lika kraftigt som de l˚aga frekvenserna, vilket g¨or att filtret inte f˚ar lika h¨og ordning och d¨armed blir filtreringen inte lika ber¨akningsm¨assigt kr¨avande. Bandpassfiltret skapades i MATLABs inbyggda verktygsl˚ada SPtool [3]. I Figur 5 visas ett spektrogram samt en energiuppskattning av en ljudsignal med h¨ogt SNR dels f¨ore och dels efter bandpassfiltrering. I Figur 6 visas samma sak som i Figur 5 fast f¨or en signal med l˚agt SNR.

Figur 5: Spektrogram av en ljudsignal dels f¨ore (a) och dels efter (b) band- passfiltrering. Energiuppskattning dels f¨ore (c) och dels efter (d) bandpassfil- trering.

F¨or att studera n¨arvaro av en dykare s˚a ¨ar signalens energiinneh˚all av bety- delse, j¨amf¨or med Ekvation (2). Detta eftersom att energin i signalen kommer att ¨oka d˚a en andning ¨ager rum. D˚a man ¨ar intresserad av signalens energi-

(12)

Figur 6: Spektrogram av en ljudsignal med l˚ag SNR dels f¨ore (a) och dels efter (b) bandpassfiltrering. Energiuppskattning dels f¨ore (c) och dels efter (d) bandpassfiltrering.

inneh˚all som funktion av tiden ber¨aknas energin i signalen ett flertal g˚anger f¨or en liten del av signalen ˚at g˚angen. F¨or att f˚a en j¨amnare och mer r¨attvis energiuppskattning anv¨ands ¨aven ¨overlappning mellan de olika energiupp- skattningarna. H¨ar anv¨andes 2048 sampel f¨or varje energiuppskattning och en ¨overlappning p˚a 20 %. Fr˚an energiuppskattningarna i Figur 5 och i Figur 7 s˚a framg˚ar det tydligt var andningarna ¨ager rum. D¨armot ¨ar det sv˚art att med blotta ¨ogat se var andningarna ¨ager rum i Figur 6 d˚a det d¨ar ¨ar f¨or l˚agt SNR.

Som tidigare setts ¨ar det sv˚art att urskilja andningarna fr˚an bruset vid l˚agt SNR och d¨arf¨or kr¨avs vidare analyser av signalen. Om frekvensen i andning- arna ¨ar n˚agot s˚an¨ar konstant kan man d˚a utnyttja en periodicitetsanalys.

En periodicitetsanalys av energiuppskattningen utf¨ors med hj¨alp av FFT.

F¨or att ¨oka antalet sampel i frekvensdom¨an anv¨ands s˚a kallad zeropadding.

Zeropadding inneb¨ar att man f¨orl¨anger signalen man vill analysera genom att l¨agga p˚a nollor efter slutet av signalen, vilket kommer att ge fler sampel i FFT:n. Eftersom att m¨ojliga andningsfrekvenser utg¨or ett v¨aldigt smalt fre-

(13)

Figur 7: I den ¨ovre grafen visas en energiuppskattning p˚a en filtrerad signal och i den undre visas FFT:n av energiuppskattningen.

kvensintervall s˚a ¨ar det viktigt att m˚anga sampel finns tillg¨angliga d˚a detta intervall utan zeropadding endast hade utgjors av ett f˚atal punkter. Om pe- riodiciteten f¨or andningar ¨ar konstant kommer ¨aven signaler med v¨aldigt l˚agt SNR att ge en tydlig spik i FFT:n vid andningsfrekvensen. Om det d¨aremot inte existerar n˚agon distinkt andningsfrekvens, det vill s¨aga att tiden mellan en andning och den efterf¨oljande andingen varierar, kommer spiken i FFT:n att f˚a en l¨agre amplitud samtidigt som den ¨aven blir bredare, se Figur 7.

F¨or att avg¨ora om en dykare ¨ar n¨arvarande eller inte studeras periodicitetsa- nalysen av energiuppskattningen. Om det inte ¨ar n˚agon dykare n¨arvarande i signalen kommer energiuppskattningen av signalen bete sig som vitt brus, det vill s¨aga att energin i signalen kommer vara j¨amnt f¨ordelat mellan samtliga frekvenser. Men om det d¨aremot ¨ar en dykare n¨arvarande s˚a kommer energin vid andningsfrekvenserna, Ea, att ¨oka. H¨ar antas m¨ojliga andningsfrekvenser vara 0,1 till 0,5 Hz, vilket motsvarar att en andningcykel ¨ar mellan 2 och 10 s l˚ang. Energin i frekvensdom¨an relateras till energin i tidsdom¨an med

(14)

Parsevals indentitet. Parsevals identitet ges av

N −1

X

n=0

|x[n]|2 = 1 N

N −1

X

k=0

|X[k]|2,

d¨ar X[k] betecknar den diskreta fouriertransformen av x[n]. Genom att en- bart summera |X[k]|2 motsvarande 0,1 till 0,5 Hz minskar man andelen brus i energin. Det blir i princip ett filter som tar bort st¨orre delen av bruset och d¨armed ocks˚a h¨ojer signal-brusf¨orh˚allandet. Genom att studera Ea i pe- riodicitetsanalysen av energisignalen och ans¨atta en rimlig tr¨oskel kan man avg¨ora om det ¨ar en dykare n¨arvarande eller inte.

Tr¨osklingen som valdes var att Ea j¨amf¨ors mot en tr¨oskel k · Eb d¨ar k ¨ar en konstant och Eb ¨ar energin f¨or de frekvenser som ¨ar h¨ogre ¨an 0,5 Hz. Om

Ea> k · Eb

s˚a indikerar detektorn p˚a att det ¨ar en dykare n¨arvarande. Tr¨oskeln k · Eb valdes f¨or att genom att ber¨akna energin Eb kan man uppskatta hur mycket brusenergi det finns mellan frekvenserna 0,1 till 0,5 Hz. Detta till f¨oljd av att energif¨ordelningen i frekvensdom¨an av energiuppsktattningen p˚a en sig- nal med enbart brus kommer var j¨amnt f¨ordelat mellan samtliga frekvenser.

F¨or att f˚a en rimlig niv˚a p˚a PF A s˚a testades konstanten k fram genom pro- gramk¨orningar p˚a inspelat brus. V¨ardet p˚a konstanten valdes till k = 0, 05.

3 Utv¨ ardering och diskussion

Ljudfilen som anv¨ands f¨or utv¨ardering av detektorn inneh¨oll omr˚aden med h¨ogt SNR, men ¨aven omr˚aden med l˚agt SNR. I Figur 8 visas ett av fallen med h¨ogt SNR och f¨or detta omr˚ade gav detektorn utslag f¨or n¨arvaro av dykare.

Man kan tydligt se att energin i intervallet 0,1 till 0,5 Hz ¨ar betydligt h¨ogre

¨an f¨or ¨ovriga frekvenser vilket tyder p˚a att en dykare ¨ar n¨arvarande. I Figur 9 visas ist¨allet ett fall med l˚agt SNR, men ¨aven h¨ar indikerade detektorn p˚a n¨arvaro av dykare. Man kan i figuren se likheter med Figur 8 ¨aven om spi- karna i detektionsintervallet ¨ar betydligt l¨agre pga det l¨agre signal till brus f¨orh˚allandet. Ut¨over dessa tv˚a fall gav detektorn utslag ¨over hela ljudfilen, med andra ord hade detektorn hundraprocentig detektion p˚a de data vi hade att tillg˚a f¨or utv¨ardering av detektion.

F¨orutom detektionen studeras ¨aven andelen falsklarm p˚a den ljudfil med

(15)

Figur 8: Spektrogram (a) och FFT (b) av en signal med h¨ogt SNR.

enbart brus vi hade att tillg˚a. ¨Aven h¨ar presterade detektorn v¨al d˚a den inte gav ett enda falsklarm under de tio minuterna med enbart brus. Ett av dessa omr˚aden med enbart brus visas i Figur 10. Man kan d¨ar ¨aven se att energiuppskattningens energif¨ordelning ¨ar j¨amnt f¨ordelat mellan samtliga frekvenser.

Utifr˚an 100 olika syntetiska ljudfiler, se Appendix B: Syntetiskt ljud, un- ders¨oktes detektorns PD beroende p˚a SNR d˚a PF A h¨olls konstant p˚a 0,1. Den h¨ar typen av grafer kallas f¨or ROC-kurvor, d¨ar ROC ¨ar en akronym Reciever Operating Characteristic. Fyra olika ROC-kurvor skapades f¨or att unders¨oka variationer i periodicitetens inverkan p˚a detektorns prestanda. Tv˚a olika ty- per av andningssignal genererades; en d¨ar andningarna ¨ar helt periodiska och en d¨ar periodtiden varierar mellan andningcyklerna. Dessa unders¨oktes med tv˚a olika typer av detektor; en som summerade Ea mellan 0,1 och 0,5 Hz och en som summerade Ea mellan 0,19 och 0,21 Hz. Fr˚an Figur 11 framg˚ar det att detektorn som anv¨ands, d¨ar Easummeras mellan 0,1 och 0,5 Hz, prestan- da inte p˚averkas n¨amnv¨art av den mer oregelbundna periodiciteten. Detta beror p˚a att de oregelbundna andningarna fortfarande ligger inom interval- let f¨or normal andningsfrekvens, ¨aven om enskilda andningscykler uppvisar

(16)

Figur 9: Spektrogram (a) och FFT (b)av en signal med l˚agt SNR.

stora skillnader sinsemellan. Med det smalare detektionsintervallet ser man att man fick en b¨attre prestanda f¨or den helt regelbundna andningen tack vare att man d˚a har filtrerat bort en st¨orre andel brus. Nackdelen som det h¨ar medf¨or ¨ar att toleransen f¨or oregelbundenheter mellan andningscykler minskar v¨asentligt.

Ett av m˚alen var att detektorn skulle ha kort exekveringstid f¨or att m¨ojligg¨ora realtidsk¨orning. Man vill d˚a ¨aven att programmet ska kunna k¨oras med minst 50 % ¨overlapp. Programmets exekveringstiden p˚a v˚ara privata b¨arbara da- torer var cirka 15 s, s˚a utifr˚an det anser vi att exekveringstiden ¨ar kort nog f¨or att metoden skulle kunna implementeras f¨or realtidsk¨orningar.

(17)

Figur 10: Spektrogram (a) och FFT (b) av en signal best˚aende av enbart brus. D˚a ingen periodisk andning f¨orekommer ¨ar amplituden ungef¨ar lika stor ¨overallt.

(18)

Figur 11: ROC-kurvor ¨over ljudinspelningar med helt periodisk andning och ljudinspelningar med n˚agot varierande periodtid.

(19)

4 Slutsats

Med metoden som presenteras i den h¨ar rapporten ¨ar det m¨ojligt att med l˚ag sannolikhet f¨or falsklarm detektera dykare ¨aven i n¨arvaro av starkt brus. S˚a utifr˚an detta anser vi att programmet uppfyller v˚art huvudsakliga m˚al med projektet. Med de data vi har haft tillg˚ang till s˚a ¨ar det emellertid sv˚art att s¨aga exakt hur v¨al detektorn fungerar i skarpt l¨age. F¨or att med s¨akerhet kunna uttala sig om den verkliga prestandan skulle ett st¨orre statistiskt un- derlag i form av en stor m¨angd autentiska k¨orningar vara n¨odv¨andigt. Ett annat av m˚alen var att man skulle kunna k¨ora detektorn i realtid, och utifr˚an de exekveringstider vi har haft p˚a v˚ara personliga b¨arbara datorer anser vi det fullt m¨ojligt att denna metod kan till¨ampas i realtid.

Utifr˚an ROC-kurvorna som presenteras i rapporten framg˚ar det tydligt att man skulle kunna detektera dykare vid en l¨agre SNR om man anpassade metoden b¨attre efter hur periodiciteten ser ut. En annan f¨orb¨attring av me- toden skulle kunna vara att ˚astadkomma en v¨al fungerande prewhitening, vilket skulle g¨ora det m¨ojligt att utnyttja Neyman-Pearsondetektorn.

5 Referenser

[1] Sven Erick Alm & Tom Britton. Stokastik: Sannolikhetsteori och sta- tistikteori med till¨ampningar. Ljubljana, Slovenien: Liber, 2009.

[2] Steven M. Kay. Fundamentals of statistical signal processing, detection theory. Upper Saddle River, New Jersey: Prentice-Hall, Inc. A Simon &

Schuster Company, 1998.

[3] MathWorks. Maj 2012. url: http : / / www . mathworks . se / help / toolbox/signal/ref/sptool.html.

(20)

6 Appendix

Appendix A: Prewhitening

Hypotesen bakom varf¨or man vill utf¨ora prewhitening ¨ar att alla frekvens- omr˚aden inneh˚aller n˚agon intressant information. Man vill d¨arf¨or uppn˚a sam- ma storleksordning i hela frekvensspektrat. F¨oljden av detta ¨ar d˚a att bruset blir approximativt vitt och intressanta signaler st˚ar ut tydligare fr˚an det- ta. Till skillnad fr˚an bandpassning s˚a undviker man med prewhitening att filtrera bort de delar av den intressanta datan som befinner sig i de l¨agre frekvensomr˚adena. P˚a s˚a vis kan man tydligare urskilja andningen fr˚an bru- set. En metod f¨or att g¨ora detta direkt p˚a ljudsignalen ¨ar att i MATLAB g¨ora ett linj¨arprediktionsfilter. Man v¨aljer d˚a ett omr˚ade d¨ar man sedan in- nan vet att man enbart har brus, f¨or att d¨arefter med matlabfunktionen lpc(x,p) generera en prediktion f¨or signalen x i punkten x[n] av ordning p med en minsta kvadratminimering av felet. Resultatet blir koefficienterna till linj¨arprediktorn som utifr˚an tidigare sampel best¨ammer de aktuella, och det uppskattade felet.

ˆ

x[n] = −a[2]x[n − 1] − a[3]x[n − 2] − · · · − a[p + 1]x[n − p]

Dessa koefficienter kan sedan anv¨andas tillsammans med matlabfunktionen filter() med resultatet att bruset blir approximativt vitt. Signaler som skil- jer sig fr˚an bruset (andning) kommer nu att framtr¨ada tydligare och inte l¨angre dr¨ankas i det energirika, l˚agfrekventa bruset. Det uppenbara proble- met med det h¨ar angreppss¨attet ¨ar att man redan innan filtrering p˚a n˚agot vis m˚aste finna ett omr˚ade att g¨ora brusuppskattningen p˚a. Om man i detta omr˚ade f˚ar med n˚agot som ¨ar andning kommer filtreringen att bli felaktig.

F¨or att genomf¨ora filtreringen beh¨over man allts˚a lokalisera ett omr˚ade d¨ar man enbart har brus. F¨or att g¨ora detta beh¨over man p˚a n˚agot vis kunna indikera andning redan innan filtrering, vilket blir ett cirkelresonemang. Man vill ¨aven g¨ora brusuppskattningen kontinuerligt eftersom risken ¨ar stor att bruset ¨andrar karakt¨ar med tiden.

Alternativet ¨ar att man ist¨allet g¨or ett spektrogram och utifr˚an detta ge- nomf¨or prewhitening. Man uppskattar d˚a energin f¨or varje frekvens f¨or sig vid varje tidpunkt. Antagandet ¨ar d˚a att ljudsignalen ¨ar fri fr˚an andning

˚atminstone 50 % av tiden. Man delar sedan energin vid den aktuella frekven- sen med uppskattningen av brusstyrkan och uppn˚ar p˚a s˚a vis samma stor- leksordning f¨or alla frekvenser, vitt brus. Den h¨ar metoden ger f¨ordelen att man inte beh¨over finna ett sammanh¨angande omr˚ade att g¨ora brussuppskatt- ningen p˚a. Problematiken h¨ar ligger i att det ¨ar v¨aldigt prestandakr¨avande

(21)

att beh¨ova g˚a igenom dessa steg och hantera spektrogrammet d˚a det handlar om mycket stora datam¨angder.

Figur 12: Spektrogram och energiuppskattning f¨ore och efter prewhitening.

(22)

Appendix B: Syntetiskt ljud

F¨or att utveckla metoden kr¨avs ljudinspelningar, dock ¨ar tillg˚angen till ljud- inspelningar begr¨ansad d˚a det ¨ar dyrt att framst¨alla dem. Om man vill ¨oka tillg˚angen p˚a material att arbeta med kan man generera syntetiskt ljud. F¨or att g¨ora detta m˚aste man ha k¨annedom om brusets och andningens karak- teristik. Genom att f¨orst studera riktiga ljudinspelningar erh˚alls denna in- formation. D¨arefter skapas syntetiskt ljud med samma karakteristik som det verkliga ljudet.

Det syntetiska bruset skapas genom att filtrera vitt brus med ett filter som har ett amplitudsvar som motsvarar spektrumet av signalen man vill efter- likna. Med en j¨amf¨orelse av brusets spektrum i Figur 1 och filtrets ampli- tudsvar i Figur 13 framg˚ar det att det syntetiska bruset kommer ha samma karakt¨arstik som det verkliga bruset. N¨ar man sedan vill skapa det syntetiska ljudet adderar man syntetiska andningar till det redan skapade bruset. And- ningarna skapas p˚a samma s¨att som bruset och adderas till bruset p˚a s˚adant s¨att att det blir en trov¨ardig andningsfrekvens. F¨ordelar med syntetiskt ljud

¨ar att man l¨att kan variera SNR samt periodicitet i andningen. Man kan ¨aven konstruera ljud d¨ar periodtiden mellan andningarna varierar.

(23)

Figur 13: Spektrum ¨over det syntetiska bruset.

Figur 14: Spektrogram ¨over den syntetiska signalen.

(24)

Appendix C: Begrepp

CFAR, Constant False Alarm Rate, syftar p˚a att andelen falsklarm ¨ar kon- stant, det vill s¨aga att sannolikheten f¨or falsklarm ska vara oberoende av hur signalen beter sig. Om till exempel styrkan p˚a bruset ¨okar ska inte detta leda till en st¨orre andel falsklarm.

FFT, Fast Fourier Transform, ¨ar en metod f¨or att analysera frekvensin- neh˚allet i en signal.

SNR, Signal to Noise Ratio, syftar p˚a f¨orh˚allandet mellan energin i signa- len (den efters¨okta komponenten av m¨atningen) och energin i bruset (¨ovriga komponenter som har uppf˚angats av m¨atningen).

Spektrogram ¨ar en visualisering av energif¨ordelningen mellan olika frekven- ser i en signal som funktion av tiden.

ROC, Receiver Operating Characteristic eller ROC-kurva ¨ar en grafisk re- presentation av en detektors prestanda.

PD, Sannolikhet f¨or korrekt detektion hos en detektor.

PF A, Sannolikhet f¨or falsklarm hos en detektor.

References

Related documents

Rätten lät Svensson utförligt redo- göra för den vid denna tid mindre kända elektricitetens användning i galvaniska bad, hur han framställt elt eL batteri,

Endast definitioner och trigonometriska r¨ aknelagar f˚ ar anv¨ andas utan att de f¨ orst bevisas. Sida 2

[r]

Po¨ angen p˚ a godk¨ anda duggor summeras och avg¨ or slutbetyget.. L¨ osningarna skall vara v¨ almotiverade och

Beslut enligt samhällsbyggnadsnämndens delegationsordning C.3 –C.4 Beslutet får enligt 25 § lagen om lägenhetsregister (2006:378) inte överklagas. Fastighet

[r]

En huvudaktör inom den europeiska tjänstesekto m. Vi hjälper individer och familjer, företag och organisationer. Vi gör det möjligt för våra kunder att kopplas samman och

Solna stad och Signalisten har fram till idag haft egna organisationer för sina förhyrda bilplatser.. För att ge Solnaborna en bättre service och en effektivare organisation samlas