Undersökning av lämpliga sensorer till ett övervakningssystem för farliga zoner

(1)

Examensarbete

Civilingenjör i Datateknik

Undersökning av lämpliga sensorer till ett

övervakningssystem för farliga zoner

Examenarbete 15hp

2019-09-20

(2)

(3)

Abstract

This report presents surveys of various techniques to identify people in a pre-determined area. RCWL-0516 radar module and camera monitoring were met-hods that were investigated and tested. A distance measurement test was done on RCWL-0516, once through different materials and another with sensitivity manipulation of the module. At the same time, we tested various image analy-sis methods in connection with camera surveillance. In the result, we concluded that video surveillance with image analysis, for example You-Only-Look-Once-algoritmen (YOLO), was a good solution to the problem presented while the radar module was not as suitable.

KEYWORDS: RCWL-0156, Human Detection, Image Analysis, YOLO, Risk Zones

(4)

(5)

Sammanfattning

I denna rapport presenteras undersökningar av olika tekniker för att identi-fiera personer i ett förbestämt omr˚ade. RCWL-0516 radarmodul och kame-raövervakning var metoder som undersöktes och testades. Distansmätningstest gjordes p˚a RCWL-0516, genom olika material och med känslighetsmanipulering av modulen. Samtidigt s˚a testades olika bildanalysmetoder i samband med ka-meraövervakning. I resultatet kom vi fram till att videoövervakning med bilda-nalys, till exempel You-Only-Look-Once-algoritmen (YOLO), var en bra lösning p˚a det presenterade problemet medan radarmodulen inte var lika lämpad. Nyckelord: RCWL-0156, Identifiering Av Människor, Bildanalys, YOLO, Risk-zon

(6)

F¨

orord

Vi skulle vilja tacka företaget vi gjorde detta arbete i samarbete med och även ett stort tack till v˚ar handledare Hans-Erik Eldermark fr˚an Högskolan i Halm-stad för all stöd vi fick av honom.

Halmstad, 26/08/2019 ———————————– Fre. Arv. Sam. Aou.

(7)

Inneh˚

all

1 Inledning 1 1.1 Syfte . . . 1 1.2 Fr˚ageställningar . . . 2 1.3 Kravspecifikation . . . 2 2 Bakgrund 3 2.1 Problemställning . . . 3 2.2 Overvakningstekniker¨ . . . 4 2.2.1 Dopplereffekt . . . 5 2.2.2 Infraröd . . . 5 2.2.3 Lidar . . . 6 2.2.4 Kameror . . . 6 2.3 Bildanalys . . . 7

2.3.1 Bakgrund-Subtraktion (Background Subtraction) . . . 7

2.3.2 Kantdetektion (Edge detection) . . . 7

2.3.3 Objektidentifiering (Object recognition) . . . 9

2.3.4 Haar Cascade . . . 12

3 Metoder 13 3.1 Sammanfattning . . . 13

3.2 Material . . . 13

3.3 Koppling och Experimentering . . . 14

3.3.1 Koppling . . . 14

3.3.2 RCWL-0516 Distansm¨atning . . . 15

3.3.3 RCWL-0516 Distansreglering . . . 16

3.4 Bildanalys . . . 18

3.4.1 Programmeringsspr˚ak . . . 18

3.4.2 Bakgrund-Subtraktion (Background Subtraction) . . . 18

3.4.3 Objektidentifiering (Object Recognition) . . . 19

3.4.4 Edge Detection . . . 19

3.4.5 Haar Cascade . . . 20

3.5 Skicka Styrsignal Till Externt System . . . 21

4 Resultat 23 4.1 RCWL-0516 . . . 23

4.2 VMA314 PIR . . . 25

4.3 Infrar¨od . . . 25

4.4 Bildanalys . . . 26

4.5 Utv¨ardering av Tekniker . . . 28

5 Slutsats 29 6 Diskussion 31 Referenser 32 7 Bilaga 35 7.1 RCWL-0516 Schematics . . . 35

7.2 Koden till Haar Cascade och Edge Detection . . . 36

7.3 Koden till Background Subtraction . . . 37

7.4 Koden f¨or Bluetooth Styrsignalen . . . 38

(8)

1 Inledning

Det har experimenterats med radar sedan 1886 vilket ledde till skapandet av RA-DARn (Radio Detection And Range) ˚ar 1935. Radar är ett övervakningssystem som använder radio signaler och kan upptäcka sträcka, vinkel och hastighet p˚a ett objekt. Idag s˚a används det av militären, men ocks˚a i olika system för att upptäcka objekt t.ex i automatiska dörrar eller för att upptäcka turbulens i moln.

I detta projektet s˚a undersöks svagheterna samt möjligheterna med RCWL-0516 dopplerradar i samband med säkerhetsövervakning av arbetsplatser. And-ra övervakningsmetoder och tekniker kommer ocks˚a undersökas för att hitta den bästa möjliga sensorkombinationen för problemet. Olyckor p˚a arbetsplat-ser är inte ovanliga, 2018 var det 50 personer som miste livet som följd av en arbetsplatsolycka[1]. Vid förflyttning av gods är det viktigt att inget g˚ar fel, men om en olycka skulle inträffa s˚a skall operatören inte vara i en s˚adan position att hen utsätts för risken att skadas. För tillfället finns inget system som varnar om föraren befinner sig i en riskzon utan det är helt upp till denne att bedöma sin position som säker.

1.1 Syfte

Syftet är att, ˚at ett företag som av konkurrensskäl inte vill synas, undersöka tek-niker för att använda till ett personsäkerhetssystem för lastning av tungt gods. I första hand kommer radarmodulen RCWL-0156 testas d˚a företaget önskade detta.

(9)

1.2 Fr˚

agest¨

allningar

• Kan man reglera avst˚andet f¨or detektering dynamsikt p˚a RCWL-0516 modulen?

• Kan RCWL-0516 modulen urskilja personer fr˚an andra förem˚al? • Vad för sensorer krävs för att man ska kunna identifiera en människa? • Vad för störningar är de olika sensorerna känsliga för?

1.3 Kravspecifikation

• Systemet skall kunna identifiera en person i ett visst omr˚ade

• RCWL-0516 modulen ska inte st¨ora/st¨oras av andra utrustningar och skall vara kompatibla med frekvenserna: 2.4 GHz, 433 MHz, 434 MHz, 869MHz. • Signalerna skall vara p˚alitliga och repeterbara.

• Felmarginal p˚a ±50cm.

(10)

2 Bakgrund

¨

Overvakningssystem finns nästan överallt för att till exempel bevaka tillg˚angar (s˚a som hus eller lager). Sensorerna i dessa system upptäcker värmestr˚alning, rörelser eller tar in rörliga bilder via en optisk- eller termisk kamera. I ett vanligt hemlarm bevakas ytor med sensorer som upptäcker värme, s˚a kallade PIR (Pas-siv Infraröda)-sensorer. I hemmet eller p˚a ett lager kan man ha kompletterande kameror som sätts ig˚ang efter rörelser upptäckts, dessa bilder skickas vidare och bedöms om det skall skickas väktare eller dylikt. System för att skydda personer fr˚an skador i arbetet finns, som till exempel tv˚ahandsgrepp för att operatören inte ska kunna vara i det farliga omr˚adet medan maskinen körs, detta förhindrar dock inte att andra personer än operatören befinner sig där. S˚a för att skyd-da andra personer och operatören vid en förflyttning av tungt gods s˚a ville företaget hitta en lösning där ett system med hjälp av t.ex en radar upptäcker om personer befinner sig inom ett omr˚ade där hen utsätts för en skadorisk om lasten av n˚agon anledning skulle lossna. Systemet skulle i det fallet skicka en styrsignal till systemet som styr kranarna och tillfälligt stoppa dessa tills dess att personen är utanför omr˚adet.

2.1 Problemst¨

allning

Figur 1: Riskzon runt lastbil Med hj¨alp av ett s¨akerhetssystem

som stoppar maskinerna och varnar med en styrsignal, som skickas till ett externt system i situationer där operatören utsätts för skaderisker, se figur 1, hade antalet tillbud kun-nat minskas. Är en radarsensor ett bra alternativ i ett s˚adant system? Uppgiften är att undersöka en spe-cifik doppler-radar modul, RCWL-0516, för att se hur lämplig den är att detektera personer i ett visst fält, om

den har de egenskaper som efterfr˚agas och om det i s˚a fall g˚ar att anv¨anda denna teknik i ett s¨akerhetssystem.

RCWL-0516 är till sitt lilla pris en attraktiv modul, det g˚ar dock inte att hitta ett officiellt datablad för modulen, förutom det p˚a kinesiska. Detta har lett till att det finns en del entusiaster [2][3] som tagit sig tid att undersöka potentialen i den och skrivit ned en del information som använts som källa till experimenten i rapporten.

Systemet kan komma att behöva fler än bara en typ av sensor för att öka tillförlitligheten och precisionen av detektion. En möjlig metod är att använda en termokamera eller en infraröd sensor (PIR). Det finns exempel p˚a hur man kan, med en termokamera, urskilja siluetten av en människa med hjälp av till exempel background subtraction”[4].

(11)

2.2 Overvakningstekniker

¨

Att använda sig av en modul är inte tillräckligt för att ha ett p˚alitligt säkerhetssystem. P˚a grund av det s˚a m˚aste andra metoder och tekniker undersökas för att hitta den mest lämpliga sensorkombination.

För varje sensor s˚a existerar fördelar och nackdelar. Meningen med att kombi-nera sensorerna är att använda varje sensorsfördel för att tillverka ett effektivt säkerhetssystem som i sin tur har högre p˚alitlighet. Datakombinering kan hända i fyra olika niv˚aer[5]:

• Signalniv˚a kombinering, där signalerna fr˚an olika sensorer är kombine-rade i en ny förbättrad signal.

• Pixelniv˚a kombinering är genomfört p˚a n antal bilder där dem kom-bineras en pixel i taget. Resultatet är en bild som är lättare att bearbeta under bildanalysfasen.

• Funktionsniv˚a kombinering, där olika viktiga funktioner fr˚an olika bi-omertriksa system är kombinerat med m˚alet att förbättra noggrannhet p˚a igenkänning.

• Beslutniv˚a kombinering kombinerar information fr˚an mer abstrakta resultat fr˚an olika algoritmer f¨or att skapa ett slutligt beslut.

(12)

2.2.1 Dopplereffekt

Dopplereffekten är en förändring i ljud-, ljus- eller v˚agfrekvens som uppst˚ar när en källa rör sig mot eller ifr˚an ett m˚al [6]. Dopplereffekten g˚ar att dela in i tv˚a olika delar, Akustisk Dopplereffekt [7][8][9] och Relativistisk Doppleref-fekt.

När källan eller mottagaren rör sig i förh˚allande till ett medium som vatten eller luft är det den Akustiska Dopplereffekt som är aktuell. I ett läge där en observatör o rör sig mot eller ifr˚an en källa, radarn r, i hastigheten Vo s˚a är frekvensen fo som observatören uppfattar

fo= fr( Vc± Vo

Vc )

där fr är frekvensen som källan skickar ut och Vc är ljudets hastighet, och d˚a blir dopplershiftet f : f = fo( Vc Vc∓ Vr ) ≡ f = fr( Vc± Vo Vc )( Vc Vc∓ Vr ) = fr( Vc± Vo Vc∓ Vr )

• Om observatören flyttar sig mot källan är V0positivt. • Om observatören flyttar sig ifr˚an källan är V0 negativt. • Om källan flyttar sig ifr˚an observatören är Vr positivt. • Om källan flyttar sig ifr˚an observatören är Vr positivt. 2.2.2 Infraröd

De mänskliga ögonen kan se ljus som ligger inom v˚aglängderna 380-740 nm. Infrarött ljus har en v˚aglängd som är större än 740 nm och är upp till 1 mm. Infraröda str˚alningar produceras när atomer och molekyler är i rörelse. Varje objekt som har en temperatur som ligger över absoluta nollpunkten str˚alar i infrarött. Högre temperaturer p˚a ett objekt leder till att atomerna rör sig snabbare som i sin tur leder till kortare v˚aglängder p˚a ljuset.

Infraröda sensorer är uppdelade i tv˚a kategorier, Aktiv IR och Passiv IR. Aktiv IR är en typ av sensor som sänder ut en infraröd str˚ale och mäter tiden det tar för det reflekterade ljuset att komma tillbaka. Denna typ av sensor kan mäta distans. Passiv IR är en typ av sensor som endast mäter infrarött ljus som den erh˚aller.

(13)

2.2.3 Lidar

Lidar st˚ar för ”Light detection and ranging” och fungerar som en radar med laserljus. Laserstr˚alar skickas ut, studsar tillbaka och avst˚andet kan räknas ut genom att mäta hur l˚ang tid det tar, se ekvation 1, där s st˚ar för sträcka (me-ter) till objektet, c st˚ar för ljusets hastighet (meter/sekund) och t st˚ar för tid (sekunder) det tar för laserstr˚alen att komma tillbaka.

s = (c ∗ t)

2 (1)

Tekniken fungerar även p˚a gaser d˚a olika gaser reflekterar visst ljus och används bland annat för att mäta utsläpp fr˚an vulkaner samt övervakning av stra-tosfäriska ozonskiktet men även i bilar för att upptäcka g˚angtrafikanter. För att urskilja g˚angtrafikanter kan till exempel de karaktäristiska kännetecken samt vil-ka ljusv˚agor som reflekteras av en människa användas[10]. I en rapport fr˚an 2013 beskrivs det om hur man kan använda en flash-lidar i ett övervakningssystem i vilket man ocks˚a upptäcker mänskliga drag p˚a ett objekt. I rapporten redovisas algoritmer för att urskilja människor med hjälp av data fr˚an radarn [11]. 2.2.4 Kameror

Kameror i övervakningssystem är inte ovanliga. Övervakningssystem som använder kameror med automatisk detektion av människor är sv˚ara att hitta, de flesta larmar p˚a grund av rörelse i en viss yta. Fotoner tas in genom kameralinsen och läses av en CMOS eller en CCD som omvandlar fotonerna till en digital sig-nal. I kombination med bildanalys, kan man identifiera människor i en bild med tekniker som kantdetektion(edge detection), bakgrundsubtraktion (background subtraction) och objektidentifiering (object recogition). I ett arbete fr˚an 2007 [12] redovisas hur människor upptäcks i en bild fr˚an en infraröd kamera med hjälp av algoritmer utformade att upptäcka g˚angtrafikanter.

(14)

2.3 Bildanalys

2.3.1 Bakgrund-Subtraktion (Background Subtraction)

Bakgrund-Subtraktion är en bildanalysmetod som jämför olika bildrutor av sam-ma scen för att upptäcka rörelse med hjälp av en statisk kamera. För att meto-den ska fungera p˚a det mest optimala sättet, s˚a krävs det att en av bildrutorna inte har rörlese i sig. Metoden subtraherar tv˚a olika bildrutor där resultatet ¨

ar rörelsen. I verkligheten s˚a är det sv˚arare att konstant f˚a en bildruta utan rörelse. För att lösa det s˚a finns det olika metoder och algoritmer som är till att f˚a fram den bästa möjliga jämförelsen. Enligt Massimo Piccardis [13] al-goritmjämförelse s˚a har ”Running Gaussian average”-algoritmen en acceptabel noggrannhet och har en l˚ag minnesanvändning. OpenCV har olika metoder för bildanalys, bland dessa finns bakgrundssubtraktion. Metoderna inneh˚aller olika algoritmer som ”Guassian Mixture-based Background/Foreground Segmenta-tion Algorithm” som har hög precision med medel i minnes användning med en mellan hastighet, och en kombination av ” Statistical Background Image Esti-mation” med Per-pixel Bayesian Segmentation”[14] som är lätta att komma ˚at.

2.3.2 Kantdetektion (Edge detection)

Kantdetektion (Edge detection) är en teknik för att skapa siluetter av objekt genom att hitta skillnaden i ljus, detta kan göras med olika matematiska meto-der. För att eliminera störningar i en bild används oftast gaussian filter för att sedan räkna ut gradienten p˚a bilden för att f˚a ut kanterna. Formel för Gaussian filter i en 2D bild är följande:

G(x, y) = 1 2πσ2e

−₍x2+ y2 2σ2 ) D¨ar σ st˚ar f¨or standardavvikelsen.

Gradienten i en bild skrivs som:

∆f = [δf δx,

δf δy]

Tekniken används i förstadiet i bildanalys och har som uppgift att göra bilden enklare s˚a att man sedan kan urskilja de delar i bilden som är intressanta, till exempel en person. Det finns befintliga algoritmer för kantdetektion s˚a som can-ny, prewitt och roberts. Roberts och prewitt är metoder som liknar varandra i det m˚an att de b˚ada använder filtreringsmatriser (convolution masks) för att sedan bestämma gradienten. Roberts använder tv˚a stycken 2x2 matriser, figur 2b, medan prewitt använder 3x3, figur 2a. Dessa filter appliceras p˚a en hel bild genom att först multipliceras med en 3x3 matris för att sedan flyttas pixelvis i x-led och y-led, som kan ses i figur 3. Canny skiljer sig fr˚an de tv˚a andra, den använder sig visserligen av en filtreringsmatris och beräkning av gradienten i de

(15)

första stegen för att sedan med hjälp av magnituden och riktningen av gradi-enten skapa skarpa och svaga kanter med en metod som kallas ”Non maximum suppression”. Efter detta s˚a fylls svaga kanter, som definieras av ett gränsvärde, i om de gränsar till en stark kant annars tas de bort [15]. I ett arbete om hur man kan följa handrörelse i bilder fr˚an en övervakningskamera har de använt kantdetektionsmetoden canny för att förfina siluetten av en person [16].

(a) Prewitt Filtreringsmatris (b) Roberts Filtreringsmatris

Figur 2: Filtreringsmatriser som anv¨ands i kantdetektionsmetoderna Prewitt och Roberts.

Figur 3: Visualisering p˚a hur prewitt’s filtreringsmatris fungerar. Den röda 3x3 matrisen multipliceras med prewitt’s filtreringsmatris för att räkna fram värdet p˚a cellen med röd ram i resultatmatrisen. Där negativa nummer blir svart, positiva blir vit och 0 blir gr˚a. I detta exempel är allts˚a inmatningsbilden en bild där halva sidan är gr˚a och andra halvan är vit. Resultatet blir en bild som ¨

ar gr˚a p˚a sidorna och vit i mitten. Denna vita del motsvarar kanten mellan gr˚a och vit i inmatningsbilden.

(16)

2.3.3 Objektidentifiering (Object recognition)

Tekniken objektidentifiering (Object recognition) är att en dator tränas p˚a att identifiera objekt av en speciell karaktär, till exempel människa, hund, cirklar med mera. För att datorn ska kunna bestämma vad det är för ett objekt behöver den först tränas p˚a förbestämda objekt. Det finns exempel p˚a hur detta används i system för att upptäcka människor [17]. R-CNN (Region Convolutional Neural Networks), fast-CNN (fast Region Convolutional Neural Network) och YOLO (You Only Look Once) är exempel p˚a metoder för objektidentifiering. R-CNN skapades för att, med hjälp av en selektiv sökalgoritm, begränsa antalet regioner där objekt identifierats till omkring tv˚a tusen, till skillnad fr˚an äldre metoder som var obegränsade. Sedan skickas dessa regioner in i ett länkat neuralt nätverk (Convolutional Neural Network) som klassfierar objekten efter de olika egenska-per de har. Detta är en l˚angsam metod som tar ungefär 47 sekunder per bild [18]. Skaparen till R-CNN vidareutvecklade sin metod för att den skulle bli snabbare, detta ledde till att fast-R-CNN skapades. Denna metoden är snabba-re eftersom istället för tv˚atusen regioner matas in s˚a är det istället hela bilden som skickas till det länkade neurala nätverket som bestämmer omr˚aden där det finns objekt. Efter det s˚a klassificeras objekten i omr˚adena p˚a samma sätt som i R-CNN. Denna metoden är betydligt snabbare än sin föreg˚angare och hanterar en bild p˚a cirka 2 sekunder. Men i detta arbete valdes en ännu snabbare metod, YOLO, för att kunna bevaka en ”farlig zon” i realtid, allts˚a kunna hantera mer ¨

an 30 bilder per sekund.

YOLO är en metod som började utvecklas 2015-2016 av Joseph Redmon, San-tosh Divvala, Ross Girshick och Ali Farhadi [19]. Deras m˚al var att öka has-tigheten för objektidentifiering samtidigt som ett högt medelvärde för precision (mean average precison, (mAP)) skulle bibeh˚allas.

För att räkna ut mAP, ekvation 2, behövs först AP (Average precision, genom-snittlig presicion) räknas ut, ekvation 3. Detta räknas ut med hjälp av precision, ekvation 5, som är ett m˚att p˚a hur bra datorn är p˚a att gissa rätt klass, och ˚aterkallelse (recall), ekvation 4, som är ett m˚att p˚a hur känslig datorn är. Dessa tv˚a m˚atten beräknas med hur bra datorn har presterat när den ”hittat” objekt. Sann Positiv betyder att datorn har lyckats klassificera ett objekt rätt, Sann Negativ betyder att datorn inte identifierat ett objekt fel, med Falsk Positiv menas att datorn har klassificerat ett objekt fel och Falsk Negativ är att datorn misslyckats att identifiera ett objekt i bilden.

(17)

Dessa i sin tur räknar man ut genom att räkna IoU(Intersection over union) vilket betyder överlappning av omr˚aden. Detta görs enkelt genom att dividera arean av överlappningen med den totala arean av omr˚adena, figur 4, sedan behövs ett gränsvärde p˚a IoU för att bestämma om det är en Sann positiv eller Falsk Positiv. Gränsvärdet av Sann Positiv är oftast IoU≥0.5, allts˚a att den gemensamma arean är mer än hälften av den totala arean av de tv˚a omr˚aden och värdet p˚a Falsk positiv definieras som IoU< 0.5.

Figur 4: Beräkning p˚a överlappning av förutsp˚att objekt och bekräftade objektet

mAP (M ean Average P recision) = 1 N N X i=1 APi (2) AP (Average P recision) = Z 1 0 p(r)dr (3) ˚ Aterkallelse(Recall)(r) = SP SP + F N (4) P recision(p) = SP SP + F P (5)

SP = Sann P ositiv F P = F alsk P ositiv SN = Sann N egativ F N = F alsk N egativ

(18)

Till skillnad fr˚an de regionbaserade(R-CNN) objektdetektionsmetoderna s˚a bestämmer inte YOLO intressanta omr˚aden före den klassificerar ett objekt. YOLO funkar p˚a följande vis:

• Bilden delas upp i ett rutn¨at som ¨ar SxS stort.

• Den förutsp˚ar B antal rektanglar per cell med en konfidenspoäng. Konfi-denspoängen räknas ut med följande formel:

Konf idens = Sannolikhet(objekt) ∗ IOU (Se ovan, f igur 4) (6) där Sannolikhet(objekt) är sannolikheten att objektet den analyserar är samma som programmets gissning.

• Varje förutsp˚add rektangel inneh˚aller x och y koordinaterna för mitten p˚a rektangeln samt bredd, höjd och konfidenspoängen för vilket objekt algoritmen förutsp˚ar.

• Den utf¨or ett ber¨aknat val av en grupp p˚a C antal klasser som programmet ¨

ar upptr¨anad p˚a.

• Resultatet blir en S x S x (B*5+C) matris som bestämmer vad det är för objekt och var det är positionerat.

Figur 5: Hur YOLO fungerar, Bildk¨alla: [19]

Skaparna till YOLO visar i sin rapport [19] att YO-LO uppn˚ar en mAP (mean average precision) p˚a 63, 4% samtidigt som den klarar 45 FPS (frames per second). De-ras andra version, Fast YO-LO, har en mAp p˚a 52, 7% med 155 FPS. De visar att deras metod, YOLO, ¨ar ¨

overlägsen när det gäller att identifiera ett objekt i real-tid jämfört med andra me-toder. Även om YOLO inte har högst mAP av metoder-na som den jämförs med s˚a klarar inte de metoder som har höga mAP av kravet p˚a att klara göra det i realtid(≥ 30 FPS). Olika versioner av R-CNN har en mAP p˚a 53, 5 − 73, 2% men med max 18 FPS.

Rapporten ”Object Detection in sports videos” [20] redovisar att YOLO preste-rar mycket bra och har en precision p˚a över 90%, nästan likvärdigt som metoden Mask R-CNN, vilket är först˚aeligt d˚a dessa metoderna är väldigt lika.

(19)

Figur 6: Jämförelse av metoder, värden fr˚an [21] I ett arbete av Chengtao

Cai, Boyu Wang och Xin Li-ang [21] s˚a undersöktes vil-ken bildanalysmetod som pas-sar bra för ett larmsystem i hemmet. Systemet skulle kun-na identifiera en person i real-tid, l˚ag upplösning och d˚aligt ljus vilket skulle kunna va-ra jämförbart med miljön för ¨

overvakningssystemet i detta arbete. De utförde experiment och jämförde de tre metoder-na: YOLO, Fast R-CNN och template matching. I deras

re-sultat, figur 6, redovisas att Fast R-CNN hade en mycket bra noggranhet i iden-tifiering av personer men att metoden inte n˚ar upp till identifiering i realtid d˚a den endast kom upp i 20 fps (frames per second (bilder per sekund)). Meto-den template matching däremot klarade hela 90 fps men var betydligt sämre i identifiering av objekt, speciellt i mörk miljö, och hade bara en noggranhet p˚a 50%. S˚a med en noggranhet p˚a 85% och en hastighet p˚a cirka 45 FPS s˚a valdes YOLO till metoden för deras övervakningssystem.

2.3.4 Haar Cascade

Figur 7: Haar Cascade Rektanglar Haar Cascade ¨ar en djupinl¨arningsmetod

utvecklad av Paul Vigeniola och Michael Jones [22] för ansiktsi-genkänning. Djupinlärning är en artificiellintelligens-teknik som är ska-pad för att imitera hjärnan p˚a att lära sig känna igen olika objekt genom att tillsätta programmet till olika bilder och villkor. Haar Cascade är väldigt effektiv p˚a bildbehandling och är ut-vecklad ˚ar 2004 men används fort-farande i dagens teknologi. Metoden börjar med att omvandla bilden till en gr˚askalabild och sedan gör om den till n˚agot som kallas integrerad bild. Pixlarna i bilden kallas för

integrera-de pixlar och integrera-deras position (x : y) är summan av alla pixelintensiteter över och till vänster om den, detta leder till en snabbare beräkning med användning av rektangelfunktioner (Kantfunktion, Radfunktion, Fyra Rektangelfunktion) se figur 7.

(20)

3 Metoder

3.1 Sammanfattning

I detta kapitel visas experimenten med RCWL-0516, kapitel 3.2 och 3.3, samt hur passiv infrar¨od (PIR) sensor, kapitel 4.2 och bildanalys, kapitel 3.4 fungerar.

3.2 Material

Radarn ska användas för säkerhet och för denna anledningen s˚a skulle den testas i olika scenarier och d˚a m˚aste resultat kunna ˚aterskapas varje g˚ang med lite till ingen fel marginaler.

Huvudmaterialet som krävs är följande:

• 0516 Radar: En mini dopplerradarsensor, med ett inbyggt RCWL-9196 chipp.

• Arduino Uno: Ett mikrokontrollerkort krävs för att underlätta analysen och testerna av radarn. Valet av mikrokontrollerkortet spelar inte n˚agon stor roll s˚a länge den kan leverera en spänning p˚a 5V.

• LED Lampa.

• Arduino IDE mjukvara: Arduinos egna mjukvara, underl¨attar program-mering av mikrokontrollerkortet.

Sidomaterial för testningen som krävs är följande: • Plastl˚ada

• Tr¨al˚ada • L¨askburk • Batteri

• Aluminiumfolie

• L¨odpenna och L¨odtenn

• M¨atinstrument: Oscilloskop(I testerna anv¨andes InfiniiVision DSOX2002A och Siglent SDS1102CML), Tumstock

(21)

3.3 Koppling och Experimentering

3.3.1 Koppling

RCWL-0516 ¨ar en radarmodul som best˚ar av 5 pins:

Pin Function

3v3 3.3V regulated output. Max 100mA (?)

GND Ground

OUT Trigger: high (3.3V) if motion detected. 0V normally.

VIN 4 - 28V supply voltage

CDS LDR 10-20k RL, U LDR >0.7V = On [2]

Radarn har fler funktioner som man kan komma ˚at genom att löda en kabel p˚a modulen. Undersökning av databladet visade att RCWL-9196 chippet hade tv˚a analoga outputs, Pin-12 och Pin-16 se bilaga 7.1 [2], som användes för att kontrollera digitala signalen. Kabellödning behövs p˚a respektive pin för att komma ˚at informationen fr˚an outputen.

Figur 8: Koppling

Kopplingen av radarn och LED var f¨oljande, se figur 8:

• 5V fr˚an Arduinon till radarns VIN Pin, r¨oda kabeln.

• GND Pin fr˚an adruinon till ra-darns GND Pin, bl˚aa kabeln. • Pin 2 p˚a Arduinon till radarns

OUT Pin, gr˚aa kabeln.

• LED lampan till Pin 8 en 100Ω resistor och till GND Pin.

(22)

3.3.2 RCWL-0516 Distansm¨atning ¨

Onskem˚alet fr˚an f¨oretaget var att radarmodulen skall klara av att detektera personer p˚a en distans upp till cirka 7 meter och att den ska vara konsistent i resultatet.

Utförande: RCWL-0516 kopplas tillsammans med en LED p˚a en kopplingsplat-ta till en arduino UNO, se avsnitt 3.3.1. Pin 12 p˚a RCWL-9196 och den digitala outputen fr˚an RCWL-0516 kopplas till ett oscilloskop för kontroll av resultat. Ett enkelt testprogram programmerades som tänder LED när radarns digitala output blir hög, vilket innebär att rörelse har blivit observerad. Distansen för detektion noteras och testet upprepas för att sedan kunna ta ett medelvärde för längden. Se resultatet av mätningarna i figur 15 och 16 avsnitt 4.1.

Eftersom radarmodulen behöver ett skyddshölje i slutprodukten s˚a behövs det testas hur olika material p˚averkar detektionsförm˚agan, se figur 9, och vilket som blir lämpligast att använda vid konstruktionen av produkten. Känsligheten p˚a radarn mättes d˚a den var i en 20mm tjock träl˚ada, i en 2mm tjock plastl˚ada, samt i en aluminium burk och slutligen framför en konkavformade aluminium-folie för att rikta str˚alningen i ett försök att öka detektionsförm˚agan.

(a) Modulen är i en läskburk som är öppen p˚a ena sidan och täkt med aluminium folie p˚a den andra

(b) Modulen ¨ar i en tr¨al˚ada med tjocklek av 20mm

(c) Modulen ¨ar i en plastl˚ada med tjocklek av 2mm

Figur 9: I figuren har man satt RCWL-0516 modulen i olika material för att mäta hur distansen förändras i de olika medium.

(23)

3.3.3 RCWL-0516 Distansreglering

I dokumentation av radarn[2] finns det förklarat att man kan lägga till en 1MΩ resistor p˚a R-GN p˚a modulens baksida, för att minska detektionslängden fr˚an 7 meter till 5 meter. Detta leder dock till permanent modifiering av modulen och blir inte dynamiskt. Ett mer effektivt sätt att begränsa distansen är att göra det med mjukvara. Som Roger Clark[3] nämner i sin slutsats vid undersökning av modulen, borde det fungera att bestämma själv, med hjälp av outputen fr˚an Pin 12 p˚a RCWL-9196, vid vilka värden det ska signalera för detektion. Notera att detta inte ändrar den digitala outputen fr˚an radarmodulen.

Utf¨orande:

Fysisktmotst˚and: Ett motst˚and p˚a 1MΩ löddes fast p˚a R-GN p˚a modulens baksida, därefter utfördes ett likadant test som utfördes i distansmätning utan begränsning, se kapitel 3.3.2. Därefter jämfördes dessa resultat.

Mjukvara: En kabel kopplas mellan Pin 12 fr˚an RCWL-9196 till en analog port p˚a arduino. Därefter läses detta värde av och om det är utanför önskat intervall s˚a skickas en signal om detektion (lampan tänds). Intervallet ändras och distansen noteras vid detektion.

Figur 10: Simulerad data för utsignalen fr˚an pin 12 och ungefärligt avst˚and för detektion vid de olika gränsvärdena.

Med hjälp av oscilloskopet upptäcktes att utsignalen fr˚an Pin 12 p˚a RCWL-9196 kun-de ligga mellan cirka 1.0 och 2.4V utan att mo-dulen ändrade den digita-la utsignalen till hög. Utan rörelser i närheten av modu-len l˚ag utsignalen p˚a cirka 1.7V, vilket blir steadystate-värdet med ett gränsvärde p˚a ± 700 mV, se figur 10.

(24)

Känsligheten som testades var 1,4V(Det förinställda i modulen), 1V, 0,8V och 0,7V. Detta ändrades manuellt i koden, se figur 11. Med de nya känslighetsgränserna utfördes det nya distansmätningar. Det testades när man gick mot modulen, när man gjorde stora rörelse framför modulen och när man stod still sen gick bak˚at ifr˚an modulen. Testet utfördes fem g˚anger per storlek p˚a gränsvärdet och sedan togs medelvärdet fram, se figur 15 och 16 i avsnitt 4.1.

Koden för att testa känslighetsgränserna

setup(){

float steady = 1.7;

float thresh;

float lowerL;

float upperL;

thresh = 1.4; //Default = 1.4, korrigeras efterhand i testningen

lowerL = steady - thresh/2; upperL = steady + thresh/2; }

loop(){

if(pin12 >= upperL || pin12 <= lowerL){ digitalWrite(LED, HIGH); delay(3000); } else{ digitalWrite(LED,LOW); } }

Figur 11: Kod som tänder en lampa om utsignalen fr˚an pin 12 ligger utanför gränsvärdena. Variabeln thresh ändrades manuellt i testningen.

(25)

3.4 Bildanalys

3.4.1 Programmeringsspr˚ak

Som programmeringsspr˚ak för att testa bakgrund-subtraktion valdes Python, detta för att biblioteket OpenCV verkade lättanvänt i kombination med det. 3.4.2 Bakgrund-Subtraktion (Background Subtraction)

Med användning av Gaussian Mixture-Based Background/Foreground Segmen-tation algoritmen, som har hög precision med mellan minnes användning och hastighet, s˚a skrev man en kod som tar in en bild/video som en input:

Koden f¨or Bakgrund-Subtraktion import cv2 import numpy as np cap = cv2.VideoCapture(0) backS = cv2.createBackgroundSubtractorMOG2() kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(3,3)) while True:

re, frame = cap.read() result = backS.apply(frame)

cv2.morphologyEX(result, cv2.MORPH_OPEN, kernel) cv2.imshow(’Frame’, frame)

cv2.imshow(’FG Mask’, result) exit = cv2.waitKey(30) & 0xff

if k == 27:

break

cap.release()

cv2.destroyAllWindows()

• createBackgroundSubtractorMOG2() [23] ¨ar en metod som skapar en in-stans av klassen BackgroundSubtractorMOG2. Den till˚ater anv¨andningen av Gaussian Mixture-Based Background/Foreground Segmentation[13] som algoritm.

• getStructuringElement(int shape, Size ksize) [24] ¨ar en metod som best¨ammer formen och storleken av pixlarna i resultatet.

• apply(InputArray src) utf¨or bakgrund-subtraktion p˚a input bilden med anv¨andning av Gaussian Mixture-Based Background/Foreground Segmen-tation algoritmen.

(26)

• morphologyEX(InputArray src, int op, InputArray kernel) [25] gör en mor-fologisk operation op p˚a input bilden src, till exempel utvigning (Dilation) som ökar ljusstyrkan p˚a ljusa pixlar och sänker ljusstyrkan p˚a de mörka medan Erosion ökar ljusstyrkan p˚a de mörka pixlar och sänker ljusstyr-kan p˚a de ljusa. OPEN och CLOSE är en kombination av Dilation och Erosion där OPEN utför Erosion först följd av Dilation och CLOSE är Dilation följd av Erosion.

3.4.3 Objektidentifiering (Object Recognition)

Metoden som valdes för undersökning av objektidentifiering var YOLO, ”you only look once”, som är en snabb och träffsäker igenkänningsmetod [19]. Denna metoden implementerades i python med hjälp av biblioteket OpenCV. För att använda YOLO s˚a behövs ett artificiellt neuronät (neural network) tränas upp s˚a det känner igen objekt. I detta arbete har det tränats med en färdig konfigu-ration [26] och vikter [27] som är fr˚an skaparen till YOLO och är open-source. Om ett objekt blir igenkänd av programmet, med en säkerhet p˚a över 50%, bil-das en rektangel med en text vid det för identifiera vad för objekt det är, se figur 22a. Eftersom systemet endast skall känna igen personer s˚a uteslöts alla andra objekt i algoritmen. För att simulera problemet som skulle lösas sattes ett visst omr˚ade i kamerans synfält till ”farligt omr˚ade” och om en person identifieras inom detta omr˚ade blir dess rektangel röd annars blir den grön, se figur 22b. Detta kan jämföras med ett arbete[28] fr˚an 2017 där författarna vidarutvecklade YOLO s˚a att den skulle bli snabbare och mer effektiv p˚a att urskilja personer för att räkna de som passerat ett markerat omr˚ade.

3.4.4 Edge Detection

För denna metoden OpenCV ”Canny Algoritmen” för användning. Metoden ¨

ar Canny(InputArray image, double threshold1, double threshold2) d¨ar image ¨

ar bilden man vill modifiera och threshold 1 och 2 best¨ammer k¨ansligheten av algoritmen.

(27)

3.4.5 Haar Cascade

Med hjälp av datan samlad under djupinlärningsprocessen lägger programmet de olika rektangelfunktioner p˚a gr˚askalabilden och subtraherar summan av pix-larna av den svarta sidan med den vita sidan.

Figur 12: Den första och den andra funktionen som valts var kantfunktion och radfunktion. Den första funktionen mäter skillnaden i intensitet mellan ¨

ogonregion och en region över de övre kinderna. Funktionen utnyttjar obser-vationen att ögonregionen är ofta mörkare än kinderna. Den andra funktionen jämför intensiteterna i ögonregionerna till intensiteten över hela näsrygg. För Haar Cascade behövdes det olika klassifierare (classifiers) som man kan hit-tade p˚a GitHub [29] för de olika edge features. En bild tas in som en input och omvandlas till en gr˚askala med cvtColor(InputArray img, COLOR BGR2GRAY) där img är bilden för att underlätta för algoritmen. Algoritmen senare jämför de olika pixlarna p˚a bilden och kollar om vilkoren till ”Edge Features”är upp-fylda, om alla rektangelfunktionerna passera, figur 7, d˚a vet man att ett ansikte hittades. I figur 20 p˚a avsnitt 4.4 s˚a ser man ett test p˚a Edge Detection och Haar Cascade.

(28)

3.5 Skicka Styrsignal Till Externt System

För att skicka en styrsignal vid detektion med objektidentifiering användes en bluetooth-anslutning fr˚an datorn till en bluetoothmodul (HC-06), kopplad till en arduino, p˚a en kopplingsplatta med en lampa som indikator för detektion. Arduinon har strömförsörjning fr˚an en powerbank. I avsnitt 7.4 kan man se hur koden för anslutning till modulen samt kommunikationen till arduinon ser ut.

(29)

(30)

4 Resultat

4.1 RCWL-0516

Testerna av RCWL-0516 modulen i olika material visade att räckvidden p˚averkades mycket negativt i en träl˚ada. Vid testning med aluminiumburken och en para-bol gjord av aluminiumfolie ökade räckvidden framför n˚agot men inte avsevärt. Enligt information [2] om modulen s˚a har RCWL-0516 360◦detektionsfält och det är därför detektions förm˚agan p˚a alla sidor testas. Modulen har 4 sidor som användes under testningen, se figur 14:

(a) Framsida (b) Baksida (c) Sidor

Figur 14: Sidorna som testas Modulen RCWL-0516

Enligt resultatet nedan, figur 15 och 16, uppt¨acks att modulen har en ”stark” sida, framsida och baksida p˚a modulen, och en ”svag” sida, sidorna p˚a

modulen.

Figur 15: Resultat av försöket att utöka distansen för detektion genom att rikta radiov˚agorna med hjälp av aluminiumförem˚al.

(31)

Figur 16: Resultatet för distansmätningen genom plast och trä.

När man ändrar känsligheten p˚a modulen, graf 17 i kapitel 3.3.3, ser man att detektionslängden inte ändras avsevärt när man ändrar gränsvärdet mellan 1,4 och 1 volt. Sedan, mellan 1 och 0,8 volt blir en liten ökning och 7 meter uppn˚as vid st˚aende rörelser och när en person g˚ar fr˚an ett stillast˚aende tillst˚and till att göra rörelser. När gränsvärdet (thresholden) sänks till 0,7 volt g˚ar det inte längre vara i närheten av modulen utan att utsignalen fr˚an Pin 12 är utanför gränsvärdena och det signalerar för detektion. Detta är även anledningen till att värdet för ”Fr˚an stillast˚aende till rörelser” saknas för detta gränsvärdet, det saknades utrymme till att göra testet.

Figur 17: Resultatet för distansmätningen med ändrad känslighet

(32)

4.2 VMA314 PIR

(a) VMA314 Sensor (b) VMA314 Baksida

Figur 18: PIR sensor

Samma tester utfördes p˚a PIR sensorn resultat som RCWL-0516. PIR sensorn har en 120◦detektions omr˚ade som sträcker sig upp till 7 meter. Sensorn skickar ut en signal när ett rörelse detekteras och kan upptäcka b˚ade människor och objekt, men den är mindre känsligt mot objekt. P˚a modulen s˚a sitter tv˚a po-tentiometer som styr fördröjningen p˚a hur l˚ang tid signalen är hög och en som styr rörlsekänsligheten se figur 18.

4.3 Infrar¨

od

Med användning av bilderna fr˚an en termisk IR kamera, figur 19b, i kombination med bildanalys som till exempel Haar-Cascade s˚a kan man känna igen människor med hög precision. Datan kan ge fel resultat när en person st˚ar i närheten av en spegel eller en vägg, d˚a kommer sensorn känna tv˚a personer istället för en p˚a grund av reflektion [30].

(a) Bild med en CMOS mo-bilkamera

(b) Bild med en IR-kamera

Figur 19: Med hjälp av en IR kamera s˚a kan man mäta höga och l˚aga tempera-turer och använda den datan för att f˚a reda p˚a om det är en människa. Färgerna ¨

(33)

4.4 Bildanalys

Vid testning att identifiera personer med Haar-cascade i avsnitt 3.4.5 kunde personers ansikte och ögon detekteras, men med de klassifierare som användes för ögon och ansikte i detta arbete detekteras ofta fel. Försök att detekte-ra överkropp lyckades inte. Canny algoritmen för edge detection eliminerar störningar och skapar silhuetter av objekt i bilden som sedan med hjälp av objektdetektering kan klassificeras, se figur 20.

Figur 20: f.h: Omodifierad bild, bild med applicerat canny-filter, ¨ogon- och an-siktsingek¨anning med Haar-cascade

Med bakgrund-subtraktion, figur 21, kan man upptäcka rörelse men det kräver bildanalys för att identifiera om rörelsen tillhör en människa.

Figur 21: Ett bakgrund-subtraktionstest d¨ar Fredrik flyttar sig in i bilden.

(34)

Resultatet fr˚an testerna av objektidentifiering visade att det är möjligt att iden-tifiera ett objekt i en bild med hjälp av bildanalysmetoden YOLO22a. Det g˚ar ¨

aven att f˚a ut personens position i bilden och p˚a s˚a vis bestämma om hen be-finner sig i ett ”farligt omr˚ade” 22b. Vid en undersökning, se stycke 3.4.3, av vad andra personer använder för tekniker vid objektidentifiering s˚a kunde det konstateras att YOLO var en mycket effektiv metod vid övervakning i realtid.

(a) Objektidentifiering (b) Simulering av ”farlig zon”.

(35)

4.5 Utv¨

ardering av Tekniker

Efter undersökningen s˚a upptäcktes att RCWL-0516 har en bra räckvidd, är billig och har en bra genomträngning, men den misslyckas med att identifiera människor med objekt som gör den oanvändbar. Därför fick andra sensorer, termiskkamera eller LIDAR, undersökas för att se om de kan uppfylla kraven som ställdes. Om man vill ha högre precision är bildanalys en dyrare men en bättre lösning. Sensorerna ska jämföras med varandra för att välja vilken som ¨

ar lämpligast för uppfylla kravet p˚a att övervaka en arbetsplats.

För att göra det s˚a skapade man ett betygssystem som baserar sig p˚a behovet av de olika funktioner per modul. Graderingen räknades med hjälp av denna funktionen Sensorbetyg= n X i=1 xiai där x är vikten och a är betyget.

Funktionerna som ska betygsättas för sensorn är:

• Räckvidden p˚a sensorn är hur l˚angt detektionsavst˚andet är.

• Dynamisk Räckvidd är ifall det g˚ar att ändra detektionsavst˚andet i realtid.

• Genomträngning är hur bra sensorn kan detektera genom olika material. • Urskilja Förem˚al är hur bra sensorn kan urskilja mellan människor och

objekt.

• Kostnad är hur billig sensorn är (Högre värde = Billigare).

• Precision är hur lätt sensorsignalen kan p˚averkas av omgivningen (Högre värde = Högre Precision).

Tabell 1: Resultat p˚a Utv¨arderingsmatris:

Som vi ser i tabell 1 s˚a är b˚ade LIDAR och en Optiskkamera med bildanalys bra kandidater för lösa problemet med att upptäcka en person i en farlig zon. Vikten g˚ar att ändra fritt beroende p˚a vilken funktion man vill prioritera mest.

(36)

5 Slutsats

Efter unders¨okningar av olika metoder och experimentering med RCWL-0516 modulen och VMA314 PIR sensor drogs det slutsatsen att det inte g˚ar att l¨osa ¨

overvakningsproblemet med endast enkla sensorer. ¨

Aven om man kunde reglerar avst˚andet dynamiskt p˚a RCWL-0516 modulen, avsnitt 4.1, lämpar den sig inte som en givare p˚a en s˚adan plats där det kan förekomma andra rörliga objekt men skulle kunna vara ett alternativ om det är s˚a om det endast rör sig personer vid ett omr˚ade och man kan filtrera de vib-rationer som stör modulen. I försöken att utöka detektionslängden med hjälp av metall, i form av aluminiumburk och en parabol gjord av aluminiumfolie, s˚a drogs slutsatsen att distansen ökade n˚agot men inte avsevärt, vilket g˚ar att utläsa fr˚an figur 15. Fr˚an resultaten i figur 16 var slutsatsen att detek-tionsförm˚agan begränsades n˚agot men ej avsevärt av plast men ganska mycket av trä. Eftersom RCWL-0516 modulen uteslöts fr˚an valen av användbara sen-sorer för människoigenkänning, s˚a utfördes det inga frekvensstörningstester p˚a den. RCWL-0516 har inget CE-certifikat, därför kan det vara sv˚art att f˚a ett system godkänt d˚a man ej vet om nästa batch av modulen klarar ett nytt CE-test. VMA314 PIR sensor gav samma resultat som RCWL-0516 modulen men med mindre känslighet mot objekt under en viss temperatur, och med bara ett 120◦synfält.

För att upptäcka människor p˚a ett p˚alitligt sätt s˚a är en kombination av en CMOS kamera med n˚agon form av bildanalys rekommenderad enligt 4.5. Med användning av objektidentifierings-metoden YOLO s˚a kan man med hög pre-cision identifiera en människa i ett förbestämt omr˚ade. YOLO är en prestanda krävande metod och det är däför en kombination med bakgrund-subtraktion eller en termisk-kamera ett bra val. Metodernas uppgift är att identifiera rörelse i omr˚adet, och skicka en signal till YOLO att börja köra, det vill säga att YOLO körs bara när man behöver att identifiera typen av rörelsen. Bilderna som tas av CMOS kameran kommer inte lagras, datan i bilden kommer endast användas under identifieringsprocessen och sedan tas bort fr˚an minnet.

(37)

(38)

6 Diskussion

Vidare i ämnet behövs det undersökas hur man skulle kombinera olika sensorer för att täcka alla de farliga zonerna p˚a ett p˚alitligt sätt. Kameror med bildanalys ¨

ar ett bra sätt men det finns risker att övervakningen kan bli blockerad av olika objekt eller störd av väder och kan därför behöva kompletteras. Om systemet skall användas i miljöer med begränsat ljus s˚a kan problem uppst˚a med vanlig kamera och d˚a skulle en termisk kamera med bildanalys passat bättre. Som [30] och [31] visar g˚ar det utmärkt att identifiera en person ur en bild fr˚an en termisk kamera med hjälp av Haar-Cascade metoden. I ett arbete fr˚an 2005 [32] s˚a redovisas dock ett system som kan, i svagt ljus, upptäcka personer i en bestämd zon med vanlig optisk kamera. Detta görs med backgroundsubtraction och sedan kan personer upptäckas med hjälp av klassifiering. Det kan ocks˚a diskuteras om i fall bildanalys används som metod om andra objekt ocks˚a ska detekteras, som till exempel gaffeltruckar med förare där människor ocks˚a sätts i fara om de befinner sig i det riskfyllda omr˚adet under lastning. I detta arbetet drog slutsatsen att radarmodulen RCWL-0516 inte var särskilt lämpad för problemet med detektion av människor i ett farligt omr˚ade. Detta betyder nödvändigt vis inte att radar bör slopas helt som metod för det finns andra sorters radar som skulle passa bättre, t.ex en Ultra Wideband(UWB) som författarna till [33] testat och med framg˚ang f˚att att identifiera en person och position utifr˚an radarsignaler. Även radar av typen LiDAR i system för bilar är känt för att effektivt detektera människor [10].

(39)

Referenser

[1] Arbetsmilj¨overket, “Statistik om d¨odsolyckor i arbetet.” https://www.av.se/arbetsmiljoarbete-och-inspektioner/

arbetsmiljostatistik-officiell-arbetsskadestatstik/ statistik-om-dodsolyckor-i-arbetet/. Accessed: 2019-03-09.

[2] J. Desbonnet, “Rcwl-0516 information.” https://github.com/ jdesbonnet/RCWL-0516. Accessed: 2019-03-09.

[3] R. Clark, “Rcwl-0516 analysis.” https://www.rogerclark.net/ investigating-a-rcwl-9196-rcwl-0516-radar-motion-detector-modules/. Accessed: 2019-03-09.

[4] V. Davis, J.W. & Sharma, “Robust detection of people in thermal image-ry.,” Proceedings of the 17th International Conference on Pattern Recogni-tion, vol. 4, pp. 713–716 Vol.4, Aug 2004.

[5] Y. H. Jiang Dong *, Dafang Zhuang and J. Fu, “Advances in multi-sensor data fusion: Algorithms and applications,” Sensors, vol. 9, pp. 7771–7784, 2009.

[6] Nationalencyklopedin, “Dopplereffekten.” Nationalencyklopedin, dopplereffekten./uppslagsverk/encyklopedi/enkel/

dopplereffekten. Accessed: 2019-03-09.

[7] Brilliant, “Doppler effect.” https://brilliant.org/wiki/ doppler-effect/?fbclid=IwAR2fiT1yuqqX2I7O4C4UI9OVUlbiPL7rp_ -Kdu0Yq0n4L5PRAzQDF3Iit30. Accessed: 2019-07-18.

[8] K. Academy, “Doppler effect: reflection off a mo-ving object.” https://www.khanacademy.org/science/ physics/mechanical-waves-and-sound/doppler-effect/v/

doppler-effect-reflection-off-a-moving-object. Accessed: 2019-07-18.

[9] LibreTexts, “The doppler effect.” https://phys.libretexts.org/ Bookshelves/University_Physics/Book%3A_University_Physics_ (OpenStax)/Map%3A_University_Physics_I_-_Mechanics%2C_Sound% 2C_Oscillations%2C_and_Waves_(OpenStax)/17%3A_Sound/17.7%3A_ The_Doppler_Effect. Accessed: 2019-07-18.

[10] A. W. T. N. Kiyosumi Kidono, Takeo Miyasaka and J. Miura, “Pedestri-an recognition using high-definition lidar,” 2011 IEEE Intelligent Vehicles Symposium (IV), pp. 405–410, June 2011.

[11] B. Lohani, S. Chacko, S. Ghosh, and S. Sasidharan, “Surveillance system based on flash lidar,” Indian Cartographer, vol. 32, pp. 77–81, Dec 2013.

(40)

[12] Jianchao Zeng, A. Sayedelahl, M. F. Chouikha, E. T. Gilmore, and P. D. Frazier, “Human detection in non-urban environment using infrared ima-ges,” in 2007 6th International Conference on Information, Communica-tions Signal Processing, pp. 1–4, Dec 2007.

[13] M. Piccardi, “Background subtraction techniques: a review,” Computer Vi-sion Group, Faculty of Information Technology University of Technology, vol. 4, pp. 3099–3104, Oct 2004.

[14] A. K. R. Alexander Mordvintsev, “Background subraction - opencv.” https://opencv-python-tutroals.readthedocs.io/en/latest/py_ tutorials/py_video/py_bg_subtraction/py_bg_subtraction.html. Accessed: 2019-06-08.

[15] I. S. Satbir Kaur, “Comparison between edge detection techniques,” In-ternational Journal of Computer Applications, vol. 145, pp. 15–18, June 2016.

[16] W. Kong, A. Hussain, M. H. M. Saad, and N. M. Tahir, “Hand detection from silhouette for video surveillance application,” in 2012 IEEE 8th Inter-national Colloquium on Signal Processing and its Applications, pp. 514–518, March 2012.

[17] M. Li, Z. Zhang, K. Huang, and T. Tan, “Rapid and robust human de-tection and tracking based on omega-shape features,” 2009 16th IEEE In-ternational Conference on Image Processing (ICIP), pp. 2545–2548, Nov 2009.

[18] R. Gandhi, “Object detection methods

ex-plained.” https://towardsdatascience.com/

r-cnn-fast-r-cnn-faster-r-cnn-yolo-object-detection-algorithms-36d53571365e. Accessed: 2019-09-17.

[19] J. Redmon, S. Divvala, R. Girshick, and A. Farhadi, “You only look once: Unified, real-time object detection,” 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 779–788, June 2016.

[20] M. Buri´c, M. Pobar, and M. Ivaˇsi´c-Kos, “Object detection in sports vi-deos,” 2018 41st International Convention on Information and Communi-cation Technology, Electronics and Microelectronics (MIPRO), pp. 1034– 1039, May 2018.

[21] C. Cai, B. Wang, and X. Liang, “A new family monitoring alarm system based on improved yolo network,” 2018 Chinese Control And Decision Con-ference (CCDC), pp. 4269–4274, June 2018.

[22] P. Viola and M. Jones, “Rapid object detection using a boosted cascade of simple features,” Conference On Computer Vision And Pattern Recog-nition, vol. 1, pp. 511–518, Dec 2001.

(41)

[23] openCV, “Motion analysis.” https://docs.opencv.org/master/de/de1/ group__video__motion.html#ga2beb2dee7a073809ccec60f145b6b29c. Accessed: 2019-09-16.

[24] openCV, “Image filtering.” https://docs.opencv. org/master/d4/d86/group__imgproc__filter.html#

gac342a1bb6eabf6f55c803b09268e36dc. Accessed: 2019-09-16.

[25] openCV, “Morphological transformations.” https://docs.opencv.org/ trunk/d9/d61/tutorial_py_morphological_ops.html. Accessed: 2019-09-16.

[26] J. Redmon, “Yolo config.” https://raw.githubusercontent.com/ pjreddie/darknet/master/cfg/yolov3.cfg. Accessed: 2019-06-08. [27] J. Redmon, “Yolo weights.” https://pjreddie.com/media/files/

yolov3.weights. Accessed: 2019-06-08.

[28] P. Ren, W. Fang, and S. Djahel, “A novel yolo-based real-time people counting approach,” 2017 International Smart Cities Conference (ISC2), pp. 1–2, Sep. 2017.

[29] S. Hameed, “Haar cascade classifiers.” https://github.com/opencv/ opencv/tree/master/data/haarcascades. Accessed: 2019-04-26.

[30] F. Christian Herdianto Setjo, Balza Achmad, “Thermal image human de-tection using haar-cascade classifier,” Proceedings of the 17th International Conference on Pattern Recognition, pp. 1–6, Aug 2017.

[31] W. Wang, J. Zhang, and C. Shen, “Improved human detection and classifi-cation in thermal images,” 2010 IEEE International Conference on Image Processing, pp. 2313–2316, Sep. 2010.

[32] Jianpeng Zhou and Jack Hoang, “Real time robust human detection and tracking system,” 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’05) - Workshops, pp. 149–149, Sep. 2005.

[33] A. G. Yarovoy, J. Matuzas, B. Levitas, and L. P. Ligthart, “Uwb radar for human being detection,” European Radar Conference, 2005. EURAD 2005., pp. 85–88, Oct 2005.

(42)

7 Bilaga

Avsnitt 3.3.1

(43)

7.2 Koden till Haar Cascade och Edge Detection

Avsnitt 3.4.4 och 3.4.5 import numpy as np import cv2 face_cascade = cv2.CascadeClassifier(’haarcascade_frontalface_default.xml’) eye_cascade = cv2.CascadeClassifier(’haarcascade_eye.xml’) cap = cv2.VideoCapture(0)

while 1:

ret, img = cap.read()

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) faces = face_cascade.detectMultiScale(gray, 1.3, 5)

for (x,y,w,h) in faces:

cv2.rectangle(img,(x,y),(x+w,y+h),(255,0,0),2) roi_gray = gray[y:y+h, x:x+w]

roi_color = img[y:y+h, x:x+w]

eyes = eye_cascade.detectMultiScale(roi_gray)

for (ex,ey,ew,eh) in eyes:

cv2.rectangle(roi_color,(ex,ey),(ex+ew,ey+eh),(0,255,0),2) _, frame = cap.read()

hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV) lower_red = np.array([30,150,50])

upper_red = np.array([255,255,180])

mask = cv2.inRange(hsv, lower_red, upper_red) res = cv2.bitwise_and(frame,frame, mask= mask) edges = cv2.Canny(frame,100,150)

cv2.imshow(’Original’,frame) cv2.imshow(’Edges’,edges) cv2.imshow(’img’,img)

k = cv2.waitKey(30) & 0xff if k == 27: break cap.release() cv2.destroyAllWindows() 36

(44)

7.3 Koden till Background Subtraction

Avsnitt 3.4.2 import numpy as np import cv2 cap = cv2.VideoCapture(0) kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(5,5)) fgbg = cv2.createBackgroundSubtractorMOG2() while(1):

ret, frame = cap.read() fgmask = fgbg.apply(frame)

fgmask = cv2.morphologyEx(fgmask, cv2.MORPH_OPEN, kernel) cv2.imshow(’frame’,fgmask)

cv2.imshow(’Yo’,frame) k = cv2.waitKey(30) & 0xff

if k == 27:

break

cap.release()

(45)

7.4 Koden f¨

or Bluetooth Styrsignalen

Avsnitt 3.5

//Pythonkod till datorn

nearby_devices = bluetooth.discover_devices(lookup_names = True, duration=5)

bd_addr = 0

for addr, name in nearby_devices:

if name == "HC-06": print("HC-06 found") bd_addr = addr break sock = bluetooth.BluetoothSocket(bluetooth.RFCOMM) sock.connect(bd_addr, 1) print("HC-06 connected") (...) if personInDanger > 0: sock.send("a") else: sock.send("b")

//Kod till arduino i arduino IDE

if(Serial.available() > 0){ inChar = Serial.read(); if(inChar==’a’){ digitalWrite(LED, HIGH); } if(inChar== ’b’){ digitalWrite(LED, LOW); } }

Figur 23: Kod f¨or bluetooth p˚a datorn och arduino

(46)

Besöksadress: Kristian IV:s väg 3 Postadress: Box 823, 301 18 Halmstad Telefon: 035-16 71 00

Undersökning av lämpliga sensorer till ett övervakningssystem för farliga zoner

Examensarbete

Civilingenjör i Datateknik