• No results found

REKONSTRUKCE ZARUŠENÝCH EEG ZÁZNAMŮ POMOCÍ ICA

N/A
N/A
Protected

Academic year: 2022

Share "REKONSTRUKCE ZARUŠENÝCH EEG ZÁZNAMŮ POMOCÍ ICA"

Copied!
47
0
0

Loading.... (view fulltext now)

Full text

(1)

REKONSTRUKCE ZARUŠENÝCH EEG ZÁZNAMŮ POMOCÍ ICA

Bakalářská práce

Studijní program: B2646 – Informační technologie Studijní obor: 1802R007 – Informační technologie

Autor práce: Tomáš Grosman

Vedoucí práce: doc. Ing. Zbyněk Koldovský, Ph.D.

Liberec 2014

(2)
(3)
(4)

Prohlášení

Byl jsem seznámen s tím, že na mou bakalářskou práci se plně vztahuje zákon č. 121/2000 Sb., o právu autorském, zejména § 60 – školní dílo.

Beru na vědomí, že Technická univerzita v Liberci (TUL) nezasahuje do mých autorských práv užitím mé bakalářské práce pro vnitřní potřebu TUL.

Užiji-li bakalářskou práci nebo poskytnu-li licenci k jejímu využití, jsem si vědom povinnosti informovat o této skutečnosti TUL; v tomto případě má TUL právo ode mne požadovat úhradu nákladů, které vynaložila na vytvoření díla, až do jejich skutečné výše.

Bakalářskou práci jsem vypracoval samostatně s použitím uvedené literatury a na základě konzultací s vedoucím mé bakalářské práce a konzultantem.

Současně čestně prohlašuji, že tištěná verze práce se shoduje s elektronickou verzí, vloženou do IS STAG.

Datum:

Podpis:

(5)

4

Poděkování

Za odborné vedení, cenné rady a doporučení bych na tomto místě rád poděkoval panu doc. Ing. Zbyňku Koldovskému, Ph.D, který byl vedoucím mé bakalářské práce.

Dále bych chtěl také poděkovat panu Ing. Jiřímu Málkovi, Ph.D., který byl konzultantem mé bakalářské práce.

(6)

5

Abstrakt

Tato práce se zabývá odstraněním nevhodných artefaktů za využití metod pro analýzu nezávislých komponent (dále ICA) na biomedicínských signálech. Konkrétně byl vybrán signál EEG, který zaznamenává činnost mozku. ICA metody jsou v této práci stručně vysvětleny. Byla zvolena metoda EFICA, protože se jedná o rychlou a účinnou metodu. Před použitím této metody byla data upravena, což je v této práci podrobně vysvětleno. Pro zjištění, zda zvolená metoda funguje správně, bylo potřeba vytvořit umělé artefakty, které by připomínaly skutečné artefakty. Metoda byla relativně úspěšná pro konkrétní artefakty. Do budoucna se dá tato metoda použít i na další artefakty.

Klíčová slova:

Elektroencefalogram, signál, analýza nezávislých komponent, artefakt, šum, záznam, frekvence

Abstract

This work deals with removing inappropriate artifacts using methods for independent component analysis (hereafter ICA) on biomedical signals. Signal EEG which records the work of brain was chosen. ICA methods are concisely described in this thesis. Method EFICA was chosen, because it is fast and efficient. Data were adjusted before using this method. It is explained in detail in this thesis. Artificial artifacts were created to find out whether the method works correctly. These artifacts resembled the real artifacts. The method was relatively successful for artifacts used. In the future, this method can be applied to other artifacts.

Keywords:

Electroencephalography, signal, independent component analysis, artifact, noise, recording, frequency

(7)

6

Obsah

Úvod ... 11

1.Popis EEG a ICA metod ... 13

1.1. EEG popis ... 13

1.2. Rozdělení EEG signálu ... 13

1.3. Slepá separace zdrojů ... 14

1.4. Analýza nezávislých komponent ... 15

1.4.1. Kritérium nezávislosti ...16

1.4.2. Princip negaussovosti ...17

2.Cíle práce ... 19

3.Návrh řešení ... 20

3.1. Použití ICA ... 20

3.2. Redukce dimenze ... 21

3.3. Umělé artefakty ... 21

3.4. Měření SNR ... 21

3.5. Skutečný artefakt ... 22

4.Realizace řešení ... 23

4.1. Redukce dimenze ... 23

4.2. Artefakt sinus 50 Hz ... 24

4.3. Artefakt nulování ... 26

4.3.1. První metoda odstranění nulované části ...28

4.3.2. Druhá metoda odstranění nulované části ...29

4.3.3. Projekce pro odstranění nulované části ...30

4.4. Artefakt simulující výpadek elektrody ... 30

(8)

7

4.5. Skutečný výpadek signálu ... 33

4.5.1. Nulování signálu ...33

4.5.2. Řešení při malém počtu kanálů ...36

4.5.3. Odstranění části matice S ...38

5.Výsledky ... 39

5.1. Sinus 50 Hz ... 39

5.2. Nulování signálu ... 40

5.3. Realističtější výpadek ... 42

Závěr ... 44

Seznam použité literatury ... 46

(9)

8

Seznam ilustrací

Graf 1: Čistý EEG signál ... 13

Obrázek 2: Stručné zobrazení slepé separace[10] ... 15

Graf 3: EEG s artefaktem sinus 50 Hz ... 24

Graf 4: EEG matice S (sinus) ... 25

Graf 5: EEG po odstranění sinusu ... 25

Graf 6: Nulovaný signál ... 26

Graf 7: Matice S po nulování ... 27

Graf 8: Matice A po nulování ... 27

Graf 9: Odstranění nulování (první metoda s použitím ICA) ... 28

Graf 10: Odstranění nulování (druhá metoda s použitím ICA) ... 29

Graf 11: Projekce signálu ... 30

Graf 12: Simulace skutečného výpadku ... 31

Graf 13: Nulování špatné části ... 32

Graf 14: Rekonstrukce po výpadku ... 32

Graf 15: Reálný výpadek ... 33

Graf 16: Nulovaný reálný signál ... 34

Graf 17: Matice S nulovaného reálného signálu ... 35

Graf 18: Matice A nulovaného reálného signálu ... 35

Graf 19: Matice S reálného signálu ... 36

Graf 20: Matice A reálného signálu ... 37

Graf 21: Rekonstrukce reálného signálu ... 37

Graf 22: Rekonstrukce reálného signálu č. 2 ... 38

Graf 23: SNR vylepšení sinus ... 40

Graf 24: SNR nulování (500 a 1000 vzorků) ... 41

Graf 25: SNR nulování (1500 až 2000 vzorků) ... 41

Graf 26: SNR realističtějšího výpadku ... 43

(10)

9

Seznam použitých symbolů

α řecké malé písmeno alfa

β řecké malé písmeno beta

δ řecké malé písmeno delta

θ řecké malé písmeno théta

µV mikrovolt

mV milivolt

s sekunda

Hz Hertz

dB decibel

A směšující matice

W separační matice

S matice nezávislých komponent

X matice smíšených signálů

Y matice výstupních signálů

W-1 inverzní matice k separační matici

U ortogonální matice

S2 diagonální matice

V matice jednotlivých komponent

S (u SNR) energie signálu

N energie šumu

 upravená matice A

Ŝ upravená matice S

sn(t) zdrojové vektory nezávislých signály

xn(t) vektory smíšených signálů

an(t) vektory směšující matice

p(sn) hustota signálu sn

ln přirozený logaritmus

I(Y) vzájemná informace signálů Y

H(yi) entropie signálu yi

E[x] střední hodnota signálu x

x3 kubická funkce proměnné x

tanh(x) hyperbolický tangens proměnné x

log10 desítkový logaritmus

Seznam použitých zkratek

EEG Elektroencefalogram

EKG Elektrokardiogram

MATLAB Matrix Laboratory – software a skriptovací jazyk pro práci s maticemi

ICA Analýza nezávislých komponent

EFICA Efficient FastICA – efektivní rychlá ICA metoda SNR Signal to noise ratio – odstup signálu od šumu

SVD Singular value decomposition – singulární rozklad matice

DFT Diskrétní Furierova transformace

(11)

10 IIR Infinite impulse response – filt s nekonečnou impulzní

odezvou

(12)

11

Úvod

Práce se zaměřuje na biologické signály s vhodným použitím metod pro odstranění artefaktů, tedy ke zrekonstruování užitečného signálu. Artefakty tvoří část signálu, která se ve výsledku nehodí. Jedná se o „nemozkové“ potenciály. Mohou být dvojího typu, technické nebo biologické. Mezi biologické se dají zařadit pohyby končetinami, mrkání očí, pohyby očí, atd. Mezi technické patří například síťové střídavé napětí s frekvencí u nás 50 Hz, dále například výpadek určitého kanálu (situace, kdy některá elektroda přestane měřit), příliš velký odpor v kabelech, šum přístroje, atd.

Konkrétně se metody testují na záznamech z EEG.

Pro medicínské účely se signál s artefakty nehodí, protože se většinou zkoumá, jestli je člověk v pořádku a nemá nějakou vadu. Tyto artefakty pak velmi nepříjemně zasahují do celkového výsledku a při velmi špatné situaci se nemusí z biologického záznamu nic zjistit. EEG záznamy se pořizují ke zjištění toho, zda nehrozí člověku epileptický záchvat, dále pro odhalení příčiny u pacientů s poruchami spánku a poruchami vědomí a také odhalují zpomalené funkce mozku. U lidí, kteří prodělali mrtvici, nebo měli těžký úraz hlavy, může pak EEG záznam vypadat zcela odlišně na rozdíl od zdravého člověka.

Artefakty se také nehodí pro správné vyhodnocení vlastností EEG signálu. Tyto artefakty mohou velmi nepříjemně změnit frekvenční charakteristiku signálů, nebo pokud chceme hledat maximální hodnoty.

Pro mě osobně se jedná o velmi zajímavou oblast aplikace informačních technologií. Nejen proto, že je zde stále mnoho prostoru pro zkoumání i v budoucnu, ale také z toho důvodu, že se jedná o oblast, která pomáhá k léčení závažných nemocí.

Cílem této práce ovšem není to, aby vznikl nějaký algoritmus, který dokáže fungovat vždy a všude. Především šlo o to, pokusit se odstranit některý konkrétní artefakt a tento postup aplikovat na realističtějších příkladech.

Tato práce byla vytvářena v širším záběru tak, aby se daly výsledky použít i pro další potřeby. Navíc by neměl být výsledek vázán jen na určité signály, ale mělo by být možné výsledky později aplikovat i na jiné typy signálů. Za takové typy jiných signálů považujeme například EKG, zvukový záznam z více mikrofonů naráz a další.

(13)

12 Jakožto vývojové prostředí a zároveň programovací jazyk byl zvolen MATLAB.

Pro tento jazyk se však lépe hodí označení skriptovací. Tento jazyk byl zvolen především z toho důvodu, že se pro práci se signály velmi hodí a také proto, že s ním mám větší zkušenosti než s jinými programovacími (skriptovacími) jazyky, které se touto oblastí zaobírají.

(14)

13

1. Popis EEG a ICA metod

1.1. EEG popis

EEG sleduje mozkovou aktivitu člověka. Tato aktivita se zaznamenává pomocí elektrod, které jsou umístěny na povrchu hlavy. Elektrody měří elektrické potenciály, které vznikají mozkovou činností. Mozkovou činnost způsobuje pohyb nabitých částic mezi jednotlivými nervovými buňkami. Signál, který se dostane na povrch hlavy má ovšem velmi malé napětí, řádově se jedná o mikrovolty. Pro srovnání, EKG signál má asi tisíckrát vyšší napětí, které se snímá. Přístroj EEG tedy musí být schopen tyto signály zesílit tak, aby se jich dalo využít.

Graf 1: Čistý EEG signál

Většinou se používá jedna barva pro vykreslení EEG signálu. V této práci bylo použito více barev, protože je pak lépe poznat, co v signálu nemá být. Každý graf v tomto dokumentu má dole kanál číslo 1, nahoře je poté kanál s nejvyšším číslem.

1.2. Rozdělení EEG signálu

EEG signál se dá dělit do 4 základních skupin podle frekvence, které jsou označeny písmeny řecké abecedy na δ, θ, α a β.

Pásmo δ je fyziologická základní aktivita ve věku do jednoho roku dítěte. Tato aktivita se netlumí otevřením očí. U dospělého člověka se tato aktivita objevuje při

(15)

14 bezesném spánku nebo při bezvědomí. Toto pásmo má frekvenci 1–3 Hz s amplitudou až 100 mV.

Pásmo θ je dominantní ve věku od 1 do 3 let. U zdravých osob se θ vlny vyskytují v centrální, spánkové a temenní oblasti. Pokud dojde k tomu, že θ vlny mají amplitudu dvakrát vyšší než α pásmo, tak se tento stav nazývá patologický. Toto pásmo se vyskytuje i při spánku. Jedná se o přítomnost snů, které jsou doprovázeny α a β pásmem. Pásmo θ má frekvenci 4–7 Hz.

Pásmo α se začíná objevovat ve věku mezi pěti až sedmi lety. Tato aktivita se tlumí otevřením očí nebo zvýšenou pozorností. Nejaktivnější je v bdělém stavu či těsně před usnutím. Toto pásmo je charakterizováno frekvencí 8–13 Hz s amplitudou

30-60 mV.

Pásmo β se objevuje současně s α aktivitou. Maximum je nejčastěji nad přední částí lebky, směrem dozadu pak amplituda ubývá. Toto pásmo charakterizuje vědomé soustředění na naše okolí, připravenost reagovat, akceschopnost. Frekvence tohoto pásma se pohybuje v rozmezí 14–30 Hz. Toto pásmo má velmi nízkou amplitudu, jen 20–30 µV.

Pásma s vyšší frekvencí než 30 Hz se poté objevují při podráždění, trémě, úzkosti nebo vysoce náročných životních situacích.

1.3. Slepá separace zdrojů

ICA metody patří do tzv. metod slepé separace zdrojů. Tedy do skupiny metod pro zpracování číslicového signálu, které pomocí separačního procesu obnovují původní zdrojové signály ze směsí. Zdrojové signály znamenají původní signály (nezávislé komponenty). Slovo „slepá“ je použito proto, že se o původních signálech neví téměř nic. Metody vychází z předpokladu nejobecnějších vlastností signálů a parametrických modelů systému.

Slepou separaci si můžeme představit jako vyfiltrování určitých hlasů z určité směsice. Jedná se o situace, kdy ve skupině lidí jich hovoří více současně, a my potřebujeme slyšet jen určité hlasy. Nebo například při koncertu kapely, kdy mikrofony snímají všechny nástroje a zpěváky, potřebujeme mít ve výsledku pouze hlas zpěváka.

(16)

15 Slepá separace zdrojů slouží právě pro tyto případy. Pro lepší vysvětlení mějme 2 mluvčí, jejichž hlasy jsou v čase t, jako zdroje označeny s1(t) a s2(t). Dále máme zaznamenány 2 směsi zdrojů, které jsou v čase t označeny x1(t) a x2(t). To se dá vyjádřit, jako

x1(t) = a11s1(t) + a12s2(t)

x2(t) = a21s1(t) + a22s2(t), (1.1)

odkud známe pouze hodnoty x. Potřebujeme získat hodnoty s, které jsou pro nás důležité. Abychom zjistili hodnoty s, tak je potřeba znát všechny hodnoty a11 … ank. Jelikož tyto hodnoty neznáme, tak je problém složitější.

Rovnice se dá zapsat i obecněji

xn(t) = an1s1(t) + an2s2(t)+ … + anksk, (1.2) kde n je n-tý kanál vstupního signálu, k je počet zdrojových signálů (tedy počet signálů, které potřebujeme zjistit). Tato rovnice se dá vyjádřit maticově

X = A · S, (1.3)

kde neznáme pravou stranu této rovnice. A označuje směšující matici.

S označuje matici zdrojových signálů. Známe pouze vstupní, smíšený signál.

Obrázek 2: Stručné zobrazení slepé separace[10]

1.4. Analýza nezávislých komponent

Analýza nezávislých komponent (ICA – Independent component analysis) vychází z předpokladu, že původní zdrojové signály S (s1(t), …, sk(t)) jsou nezávislé.

Signály X (x1(t), …, xk(t)), které známe, jsou závislé vlivem smíšení jednotlivých zdrojových signálů.

(17)

16 Potřebujeme odhadnout takovou matici A, která nahrazuje původní směsné prostředí. Předpokládejme, že tato matice je čtvercová, pak je možné určit matici W, která se rovná inverzní matici A. Matici W nazývejme separační. Poté lze zjistit jednotlivé nezávislé zdrojové signály z rovnice

S = W · X. (1.4)

Matice S obsahuje nezávislé komponenty, které by měly být zdrojovými signály, které hledáme. Na obrázku 2 jsou jako nezávislé komponenty považovány jednotlivé hlasy lidí. U EEG je složitější určit, co přesně jsou samostatné nezávislé komponenty.

Ale musíme uvažovat, že nezávislou komponentou je nějaký samotný artefakt, či jednotlivé složky signálu.

Pro ICA je několik omezení. Zaprvé, že jednotlivé nezávislé komponenty nemají Gaussovo rozdělení. Maximálně jedna komponenta může mít toto rozdělení. Dále, komponenty musí být statisticky nezávislé, takže z jedné komponenty nemůžeme odhadnout jinou. Protože odhadnutá matice je čtvercová, tak máme stejný počet komponent jako senzorů, ze kterých byl záznam pořízen.

Po použití ICA metody už nelze zpětně získat několik vlastností. V první řadě z této matice nelze určit pořadí původních signálů. Dále není možné určit energii signálů a znaménko. Pokud změníme tyto vlastnosti původních signálů, tak to na jejich nezávislost nemá vliv.

1.4.1. Kritérium nezávislosti

Lze předpokládat, že signál je posloupnost náhodných nezávislých veličin. Jeho vlastnosti jsou určeny hustotou pravděpodobnosti náhodné veličiny. Pomocí této pravděpodobnosti se dá nadefinovat nezávislost těchto signálů. Pravděpodobnostní hustoty signálů s1(t),…,sk(t) označíme p(s1),…,p(sk) a jejich sdružená hustota je p(s1,…,sk). Pak u nezávislých signálů platí

p(s1,…,sk) = p(s1) · p(s2) · · ·p(sk). (1.5)

Vhodné kritérium pro zjištění, jestli jsou signály nezávislé, je tzv. vzájemná informace. Tedy kolik informace mají jednotlivé signály společné.

I(Y) = ∫ ··· ∫ py1,…,yn(y1, … , yn)lnp py1,…,yn(y1,…,yn)

y1(y1)·py2(y2)···pyn(yn) R

𝑅 𝑑y1, … , 𝑑yn, (1.6)

(18)

17 kde py1,…,yn(y1, … , yn) a py1(y1) · py2(y2) ··· pyn(yn) jsou hustoty signálů Y.

Vzájemná informace je rovna nule pouze v případě, že Y jsou nezávislé signály.

V tomto případě čitatel a jmenovatel jsou si ve zlomku rovny a zlomek bude mít hodnotu 1. Celý logaritmus poté bude mít hodnotu 0. Takže se jedná o nezávislé signály.

Nutná podmínka nezávislosti je, že se jedná o nekorelované signály. Pokud jsou signály nekorelované a normované na jednotkový rozptyl, tak vlastností vzájemné informace je

I(Y) = ∑ 𝐻(𝑦𝑘𝑖=1 𝑖)+ 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎, (1.7)

kde H(yi) vyjadřuje entropii signálu yi. Entropie signálu je definovaná

H(yi) = − ∫ 𝑝𝑅 𝑦𝑖(𝑦) · ln𝑝𝑦𝑖(𝑦) 𝑑𝑦. (1.8)

1.4.2. Princip negaussovosti

Pro vysvětlení principu negaussovosti se dá využít minimalizace vzájemné informace signálu Y z předchozí podkapitoly. Tato minimalizace se dá vykládat jako hledání nekorelovaných signálů, které mají minimální součet entropie. Díky entropii se dá odvodit další princip ICA[1].

Signál, který má největší entropii ze všech signálů, které mají jednotkový rozptyl, má zároveň Gaussovo rozdělení a jednotkový rozptyl. Tedy čím menší je entropie signálu, tím menší má Gaussovo rozdělení. Minimalizace entropie tedy řeší tuto podmínku.

Dále je možno vycházet z centrální limitní věty, která říká, že při lineární kombinaci náhodných veličin (signálů) vznikne veličina, která se více blíží Gaussovu rozdělení, než původní náhodné veličiny. Z toho vyplývá, že signály X se více blíží Gaussovu rozdělení než původní signály. Tedy zdrojové signály S, které vzniknou díky použití ICA metody, se méně blíží Gaussovu rozdělení, než smíšené signály X.

Vzorec entropie H(yi) lze také vyjádřit jako střední hodnotu logaritmu hustoty signálu H(yi) = -E[ln𝑝𝑦𝑖]. Tato hustota ovšem není známa, proto je ve většině algoritmů nahrazena jinou funkcí. Logaritmus hustoty se nahrazuje v mnoha algoritmech funkcí x3 nebo tanh(x) (hyperbolický tangens). Pro větší přesnost je možné použít parametrický

(19)

18 odhad hustoty. Jedná se o výpočetně náročnější operaci. Nejuniverzálnější je neparametrický odhad hustoty, který je výpočetně velmi náročný a také v mnoha případech nestabilní.

Pro sepsání této kapitoly jsem vycházel z literatury [1, 2, 3, 7, 8, 12].

(20)

19

2. Cíle práce

Cílem práce bylo nastudování funkce ICA metod a jejich využití pro zpracování vícekanálových biologických záznamů. V této práci konkrétně využití pro vícekanálové EEG záznamy.

Pro ověření funkčnosti bylo potřeba otestovat, jestli jsou ICA algoritmy vhodné pro rekonstrukci EEG záznamů. Ověřovat funkčnost bylo navrženo pro rekonstrukci uměle poškozených EEG záznamů v režimu off-line v závislosti na délce dat a různém druhu poškození.

Jelikož samotný off-line záznam by nestačil, bylo z tohoto důvodu vhodné navrhnout také způsob, jak zpracovat data v režimu on-line, či batch-online. Pro tento způsob měl být vybrán vhodný ICA algoritmus.

V této práci off-line znamená, že se bere každý rámec zvlášť a vyhodnocuje se celý. Tzn., že další část signálu je provedena až po dokončení předchozího rámce a tento signál je celý rámec. U on-line se jedná o přidávání dalšího vzorku k již zpracovanému signálu. U batch-online se jedná o posouvání aktuálního rámce o nějakou určitou část s tím, že tato část je menší než velikost rámce.

Bylo potřeba zjistit, jakým způsobem se dá rozpoznat komponenta dat, která nepřísluší EEG záznamu a způsob, jak komponentu odstranit při zachování neurální složky.

Kromě umělých záznamů, bylo také cílem pokusit se tento postup ověřit na vlastních záznamech, které byly uměle zarušeny pohybovým nebo jiným podobným artefaktem.

(21)

20

3. Návrh řešení

3.1. Použití ICA

Prvním krokem pro zjištění artefaktů bylo použít ICA metodu a pokusit se vydedukovat, jak by se daly odstranit artefakty. Použitá ICA metoda byla EFICA (efficient fastICA). Byla zvolena, protože se jedná o účinnou, rychlou metodu. Její účinnost bylo třeba dále potvrdit. „Also, in comparisons to some other ICA algorithms, the EFICA algorithm is superior in this case aspredicted by the theory.“ (překlad: „V porovnání s jinými ICA algoritmy, je EFICA algoritmus lepší, jak předpovídá teorie.“) [11 s. 9].

Proces ICA metody byl proveden tak, že nejdříve za pomocí ICA algoritmu se získala matice W. Díky matici W se daly získat jednotlivé nezávislé signály S a to

S = WX. (3.1)

Dále bylo potřeba získat směšující matici A, která by znovu dokázala obnovit původní signály

A = W-1. (3.2)

Z této rovnice vychází, že

X = AS. (3.3)

Výstupní signály se v tomto případě rovnají vstupním signálům. Aby byl výstupní signál jiný, bylo potřeba změnit matici A nebo matici S. Matici A nebo S bylo potřeba také upravit pro odstranění artefaktů. Výstupní signály (zde Y) se poté daly získat jako

Y = ÂŜ, (3.4)

kde  označuje upravenou matici A. Ŝ označuje upravenou matici S.

ICA metody musí pracovat s regulárními maticemi vstupního signálu, proto je potřeba před použitím ICA metod signál upravit tak, aby se použily jen důležité části signálu a nedocházelo k tomu, že jsou na sobě lineárně závislé signály. Dochází k redukci dimenze vstupního signálu.

(22)

21 3.2. Redukce dimenze

Pro redukci dimenze se používá analýza hlavních komponent signálu. Analýza hlavních komponent se snaží zjistit malý počet kanálů, které ovšem obsahují nejdůležitější informace původního signálu.

Pro tuto operaci bylo vhodné použít rozklad pomocí singulárních čísel. Dá se říci, že se jedná o zjištění vlastních vektorů a vlastních čísel pro odhadnutou matici touto metodou. Singulární rozklad rozloží původní signál na části, které jsou potřeba a na části, které potřeba nejsou. Z této metody vzniknou tři matice U, S (označena jako S2, aby se nepletla s maticí S, která vznikne po použití ICA metody) a V, přičemž platí

X = U · S2 · VT, (3.5)

kde U je ortogonální matice, která obsahuje vlastní vektory. S2 je diagonální matice, která má kladná reálná čísla seřazená od nejvyššího a obsahuje vlastní čísla.

3.3. Umělé artefakty

Prvním důležitým krokem postupu bylo vytvoření vlastních umělých artefaktů na datech, která jsem měl k dispozici. Vytvořil jsem 3 umělé artefakty, které jsem zkoušel na těchto EEG záznamech. Tyto 3 artefakty byly sinus 50 Hz, vynulování určité části signálu a simulování skutečného výpadku elektrody za předpokladu, jak by se tento výpadek skutečně projevil. Umělé artefakty na již známých datech bez artefaktů byly výhodné, protože se na nich dá zjistit rozdíl SNR výstupních dat oproti vstupním datům. Měření SNR bylo zvoleno pro zjištění, zda je řešení správné.

Postup byl takový, že se načetla data, která byla bez artefaktů. Načtená data byla brána jako správný signál. Na nich bylo provedeno zarušení určitým artefaktem z námi vybraných artefaktů. Poté bylo potřeba artefakty odstranit.

3.4. Měření SNR

SNR (signal to noise ratio) znamená odstup signálu od šumu. Lze si to představit tak, že SNR určuje, jestli je signál správný nebo ne. Pro umělé artefakty byl zvolen signálem ten, který byl načtený. Šum byl vložen a zobrazen, jako samostatná matice.

Jelikož SNR bylo počítáno v decibelech, tak byl použit vzorec

(23)

22

SNR = 10 · log10(𝑁𝑆), (3.6)

kde S znamená energii signálu a N vyznačuje energii šumu. Tedy součet druhých mocnin signálu a šumu pro jednotlivé vektory (v tomto případě pro jednotlivé kanály).

3.5. Skutečný artefakt

Po zjištění, že umělé artefakty jsou dobře odstraňovány, bylo důležité se pokusit také použít navržené metody na odstranění umělých artefaktů na skutečných artefaktech. Jelikož byl hlavně v této práci řešen výpadek elektrody, byl tento výpadek také následně proveden na skutečném záznamu. V tomto pokuse bylo provedeno odlepení elektrody z hlavy na nějaký čas. Proto tato elektroda nesnímala správný signál.

(24)

23

4. Realizace řešení

Všechna řešení s umělými artefakty jsou prováděna na signálech, které mají 10 kanálů a vzorkovací frekvenci 1000 Hz. Než jsem se mohl pustit do nalezení artefaktů pomocí ICA metody, tak bylo třeba provést redukci dimenze.

4.1. Redukce dimenze

Pro redukci dimenze byla v MATLABu použita metoda SVD, která přesně určuje matice, které byly popsány v předchozí kapitole.

Pro toto řešení byla důležitá druhá matice, tedy matice vlastních čísel. Bylo důležité používat jen ty řádky výsledného signálu, které měly dostatečně velké vlastní číslo. Z matice S2 tak byly odstraněny sloupce, které měly dvacetkrát menší hodnotu, než byla hodnota na prvním řádku této matice, protože tyto řádky se ve výsledku zdály být neužitečné.

X‘ = Um x m · S2m x (n-a) · VT(n-a) x n, (4.1)

kde m je počet řádků vstupního signálu, n je počet sloupců a a je počet nepotřebných sloupců, respektive řádků

a = n – m + c, (4.2)

kde c je počet hodnot na diagonále matice S2, které jsou více než dvacetkrát menší než nejvyšší číslo matice S2. Tedy počet řádků, jejichž vlastní čísla jsou velmi malá vůči nejvyššímu.

Tento výsledný signál pak byl použit pro provedení ICA algoritmu. Ovšem směšovací matice byla čtvercová matice velikosti počtu řádků nové vstupní matice.

Z této matice se toho bohužel nedalo příliš zjistit, protože zpětný proces W-1*S by vrátil matici hlavních komponent, nikoliv matici, která byla potřeba.

Pro správné provedení tak matice W-1 byla vynásobena maticí U a maticí S nových rozměrů.

A = Um x m · S2m x (n-a) · W-1, (4.3)

Tato matice A byla již užitečná pro zjištění artefaktů.

(25)

24 4.2. Artefakt sinus 50 Hz

Tento artefakt se vytvořil tak, že se k jednotlivým řádkům přičetl vygenerovaný sinus 50 Hz o stejné délce jako každý řádek. Tento artefakt měl na každém řádku jinou amplitudu s tím, že amplituda se u každého kanálu zvyšovala. Takže první kanál měl nejnižší amplitudu a poslední kanál nejvyšší. Bylo to z toho důvodu, aby k žádnému kanálu nebyl přičten stejný signál.

Graf 3: EEG s artefaktem sinus 50 Hz

Je vidět, že první kanál příliš ovlivněn nebyl, ale další kanály byly ovlivněny čím dál víc. V tomto příkladu byla amplituda sinusu pro první kanál 1, pro 10. kanál byla amplituda 10. Tento signál poté po provedení ICA metody byl rozložen na části, ze kterých jedna označuje přímo 50 Hz složku.

(26)

25

Graf 4: EEG matice S (sinus)

Na grafu je vidět, že původní signál prošel nejdříve redukcí dimenze a byly z něj odstraněny 4 řádky. Z grafu lze dále poznat, že 2. řádek matice S je špatný. Poté je vynulován ten sloupec matice A, který se násobil s tímto řádkem. V tomto případě se jedná o 2. sloupec. Signál se poté znova zrekonstruoval. Jestli se jedná o špatný řádek matice S, se dá zjistit pomocí použití DFT metody. Pokud je velmi vysoká hodnota na 50 Hz, pak se jedná o kanál, který připomíná sinus 50 Hz.

Graf 5: EEG po odstranění sinusu

(27)

26 Z grafu lze vyčíst, že původní signál byl zrekonstruován bez artefaktu.

V následující kapitole s výsledky zobrazuji SNR po použití zarušení sinusem o frekvenci 50 Hz.

V tomto příkladu byl SNR před odstraněním sinusu 8,48 dB. Po odstranění sinusu byl SNR 40,21 dB. Tedy došlo ke zlepšení SNR o 31,73 dB.

Sinus se dal tedy nalézt lehce, ovšem jedná se o celkem nepraktické řešení, jelikož většina EEG přístrojů má v sobě zabudovaný filtr 50 Hz signálu, právě kvůli tomu, aby toto nevznikalo. Každopádně, kdyby někde síťový šum nebyl odstraněn, tak se tato metoda dá celkem dobře použít.

4.3. Artefakt nulování

Může se ovšem stát, že vypadne nějaká elektroda. Výpadek signálu se dá představit jakožto nějaká část signálu, která je nulová. Nulování se provádí v intervalech od 500 do 2000 v jednom rámci signálu na jednom kanále. S tím, že nulování se zvyšuje po 500. Nulovaný signál se ukázal jako velmi zajímavý artefakt, protože po provedení ICA metody byly artefakty dobře viditelné.

Graf 6: Nulovaný signál

Na grafu je vidět, že byla vynulována část 1. kanálu. Po tomto vynulování proběhla redukce dimenze. Poté byla použita EFICA metoda. SNR v tomto příkladu po

(28)

27 vynulování pro 1. kanál bylo 3,74 dB. V tomto případě nás zajímal pouze SNR pro určitý jeden kanál, protože ve výsledném signálu byl změněn jen tento kanál.

Graf 7: Matice S po nulování

Graf matice S ukazuje, že existuje kanál, který má nulovou složku. Za povšimnutí stojí kanál 2 a 4, kde je vidět, že 4. kanál doplňuje chybějící část kanálu druhého. Hledat v tomto signálu, o které kanály se jedná, by bylo složité. Ve směšující matici A je ale vidět, kde je který kanál jak použit a proto je dobré použít tuto matici.

Graf 8: Matice A po nulování

(29)

28 V grafu je barevně znázorněna matice A. Jednotlivé indexy matice jsou vyobrazeny jako obdélníky. Vpravo pak je zobrazení, jakou hodnotu která barva vyjadřuje. Zvolil jsem tento typ zobrazení, protože dobře znázorňuje, jak matice vypadá. Kdyby byla zapsána do tabulky, tak by nebyla tak přehledná, jako při použití barevné škály, která vyjadřuje hodnotu jednotlivých prvků matice.

V tomto případě matice ukazuje, že v 1. kanále výstupního signálu není brán signál ze 4. kanálu matice S. V matici A na grafu je špatná část na řádku 1 ve sloupci 4.

Tato hodnota musí být změněna tak, aby se použil správně 1. kanál matice S. Zvolil jsem dva postupy, jak tuto špatnou hodnotu v matici A nahradit. Dále z matice A je patrné, že 2. kanál matice S je velmi podobně zastoupen ve všech výstupních kanálech.

4.3.1. První metoda odstranění nulované části

První metoda byla taková, že jsem hledal pouze špatnou hodnotu matice A. Pro nalezení byl použit postup, kdy se kontroluje, jestli právě jedna absolutní hodnota ve sloupci je o dost menší než maximální absolutní hodnota v tomto sloupci. Další podmínka je, že všechny ostatní hodnoty tohoto sloupce musí být všechny kladné nebo záporné. U špatné hodnoty je to jedno, protože ta byla často s opačným znaménkem než hodnoty správné. Tato špatná hodnota byla nahrazena průměrem všech ostatních hodnot v tomto sloupci. Z grafu 7 je tedy nahrazena hodnota 1. řádku, 4. sloupce průměrem hodnot 4. sloupce všech řádků kromě 1. řádku.

Graf 9: Odstranění nulování (první metoda s použitím ICA)

(30)

29 Na grafu je vidět, že tato metoda účinkuje dobře. Porovnání s ostatními metodami je následně použito v další kapitole. U tohoto příkladu bylo SNR po provedení této metody 34,57 dB. Takže došlo ke zlepšení SNR o 30,83 dB.

4.3.2. Druhá metoda odstranění nulované části

Druhá metoda už byla složitější, protože se nejednalo o pouhé nalezení jednoho kanálu, ale dvou kanálů. Špatná hodnota byla hledána stejně jako v předchozí metodě.

Ovšem tato metoda spočívá v tom, že se musel nalézt ještě dobrý sloupec signálu. Tedy ten, kde jsou si všechny hodnoty velmi podobné a žádná hodnota tam není velmi rozdílná od maxima. Jakmile se naleznou tyto dva sloupce, tak se musí nahradit špatná část matice A. Tato špatná část matice A je nahrazena vydělením hodnoty ve stejném řádku z dobrého sloupce průměrným podílem mezi dobrým a špatným sloupcem ve všech ostatních řádcích. Hodnota je tedy nahrazena tímto podílem. Z grafu 7 je tedy nahrazena hodnota 1. řádku, 4. sloupce hodnotou, která vznikne vydělením hodnoty 1. řádku 2. sloupce průměrným podílem mezi sloupcem 2. a 4. ve všech řádcích kromě tohoto 1. řádku.

Graf 10: Odstranění nulování (druhá metoda s použitím ICA)

Z grafu je patrné, že tato metoda je také velmi účinná a navíc byla použita i pro další účely. Proč je tato metoda nakonec lepší, než první metoda, je podrobněji vysvětleno v následující kapitole s výsledky. V tomto příkladu bylo SNR po provedení metody 43,17 dB. To znamená zlepšení SNR o 39,43 dB.

(31)

30 4.3.3. Projekce pro odstranění nulované části

Pro porovnání, jestli je ICA algoritmus výhodný, bylo dobré porovnat ho i s nějakou jinou metodou, která se dá na řešený problém použít. V tomto případě byla zvolena projekce dobrých kanálů na špatný kanál. Znamená to tedy, že se musel najít špatný kanál a poté na něj použít projekci. Nalezení špatného kanálu bylo řešeno způsobem, že se hledal kanál, kde bylo několik hodnot po sobě nulových. Konkrétně bylo použito hledání 100 po sobě nulových vzorků. Tento nalezený kanál byl poté nahrazen výsledkem projekce všech ostatních kanálů.

Graf 11: Projekce signálu

Již podle grafu je vidět, že tato metoda nefunguje perfektně, což je i dále potvrzeno v následující kapitole. SNR po provedení projekce bylo 7,46 dB. To znamená, že SNR se zlepšilo pouze o 3,72 dB.

4.4. Artefakt simulující výpadek elektrody

Nulovaná část signálu nesimuluje až tak reálný výpadek elektrody ve skutečném signálu. Pro tento výpadek musí být tedy přidán jiný artefakt. Signál byl zarušen artefaktem, který z něj určitou část nahradil náhodnými hodnotami, aby to ovšem nebylo jen náhodné, bylo lepší využít IIR filtr s náhodně vygenerovanými hodnotami.

Filtr, který byl zvolen za náhodný signál:

y[n] = x[n] + y[n-1], (4.4)

(32)

31 x je vektor náhodných čísel. Jedná se o IIR filtr. Byl zvolen, protože dokáže velmi dobře simulovat skutečný výpadek, ve kterém signál neprochází příliš často nulou. Jedná se o nahrazení části signálu Brownovým pohybem. Brownův pohyb je vysvětlen jako ustavičný náhodný a neuspořádaný pohyb mikroskopických částic v plynném nebo kapalném prostředí. Výpadek elektrody je náhodný jev, protože nevíme, co přesně se stane. Proto je dobré simulovat ho pomocí Brownova pohybu.

Tato část se poté musí nalézt a nahradit nulovanou částí, aby se dala použít metoda, která je ověřena, že funguje. Špatná část byla nalezena pomocí DFT. Špatný signál znamená tu část, kde po DFT vychází vysoké číslo na velmi nízké frekvenci.

Graf 12: Simulace skutečného výpadku

Z grafu je tedy patrné, že špatná část signálu velmi ovlivní výslednou charakteristiku tohoto kanálu. Zde je velmi obsažena v sedmém kanále nízká frekvenční složka, která se poté odstraní tím, že se vynuluje. V tomto případě bylo SNR pro sedmý kanál po přidání artefaktu -12,43 dB, takže se jednalo o velmi zarušený kanál.

(33)

32

Graf 13: Nulování špatné části

Po vynulování se poté použije ICA algoritmus a metoda, která byla z metod, použitých na nulování kanálu nejlepší, aby se mohl signál zrekonstruovat nejlépe.

Graf 14: Rekonstrukce po výpadku

Na grafu je vidět, že pomocí těchto metod se dá odstranit i zdánlivě velmi nečitelný signál a artefakt zmizí. Jen to musí být artefakt, který je pouze na jednom kanále. Kdyby se měnil víc než jeden řádek matice A, tak by se daly odstranit artefakty na jiných kanálech. V tomto konkrétním případě bylo SNR po odstranění artefaktu 35,03 dB. Takže došlo ke zlepšení, které bylo 47,46 dB.

(34)

33 4.5. Skutečný výpadek signálu

Kromě umělých dat byl pořízen i záznam skutečného EEG signálu, který byl měřen na přístroji, který vlastní univerzita. Figurant jsem byl v tomto případě přímo já osobně. Signál, který byl pořízen, má pouze 5 EEG kanálů a vzorkovací frekvenci 200 Hz. Pořídil jsem záznam, ve kterém byl hlavním artefaktem výpadek elektrody, abych mohl ověřit metody nejen na umělých datech, ale i na skutečných datech.

Graf 15: Reálný výpadek

Z grafu je vidět, že výpadek proběhl u elektrody, která je zaznamenána na kanále 1. Tento výpadek trval skoro 20 sekund, takže bylo dobré vzít 10 000 vzorků, místo 5 000, protože u 5 000 vzorků by se u tohoto kanálu objevil pouze výpadek.

4.5.1. Nulování signálu

Pro první část bylo třeba vynulovat tu část signálu, kde došlo k výpadku, aby se dále mohla tato metoda použít a vyzkoušet, jestli skutečně správně funguje.

(35)

34

Graf 16: Nulovaný reálný signál

Z grafu je vidět, že byl nalezen správný kanál i správné místo pro výpadek signálu. Pro tyto reálné signály nebylo potřeba redukovat dimenzi, protože není tolik kanálů, aby matice mohla být singulární. Tzn., že matice z těchto reálných signálů byla regulární. Použila se EFICA metoda, abych mohl vidět, jestli se dá najít tato špatná část stejným způsobem nebo jestli to pro tento případ nebude fungovat správně. Teoreticky by funkčnost měla být správná, ale je nutno vzít v úvahu, že v umělých datech byl artefakt pouze ten výpadek signálu, ale zde by se mohlo stát, že bude ovlivněn i jiný kanál nějakým jiným možným artefaktem a nakonec by tedy metoda EFICA jako vadný kanál s artefaktem vyhodnotila jiný kanál.

(36)

35

Graf 17: Matice S nulovaného reálného signálu

Z grafu je vidět, že artefakt v tomto případě byl nalezen jiný, protože celý kanál 1 ze vstupního signálu je nepozměněn v matici S. Jen je zobrazen jako 3. kanál.

Graf 18: Matice A nulovaného reálného signálu

Z matice A už se nedá tak dobře poznat, kde je problém. I když jsem vyzkoušel víc postupů, jak zjistit špatnou pozici, tak automaticky to nikdy nefungovalo, protože tam byl nalezen artefakt na jiném kanále. Důvody proč tomu tak je, jsou dva.

První důvod je ten, že je málo kanálů a tak na nich výpadek nemusí být tak snadno rozpoznatelný. ICA algoritmy mají vždy lepší výsledky, pokud je více kanálů,

(37)

36 protože je z čeho čerpat. Tady je evidentní, že kanály jsou velmi odlišné a navíc se může vyskytovat i jiný artefakt, který bude mít větší význam než nulovaná část.

Druhý důvod je, že výpadek je příliš dlouhý a vzhledem k vlastnostem EEG signálu je tedy kanál 1 brán jako správný, nikoliv jako špatný. Touto metodou se tedy nedá poznat artefakt.

4.5.2. Řešení při malém počtu kanálů

Přesto jsem našel možnost, jak tento nechtěný signál nahradit jiným signálem bez artefaktu. Tentokrát jsem špatnou část nenuloval, aby bylo vidět, jestli se dá artefakt poznat i bez toho a jestli půjde jednoduše odstranit. Výpadek byl stále na 1. kanále, protože byla vybrána stejná část dat ze stejného záznamu.

Graf 19: Matice S reálného signálu

Z matice S je poznat, že tentokrát už nikde není 1. kanál zobrazen celý, jako v minulém případě. Dokonce se dá poznat, že 1. kanál matice S je špatný, protože je patrné, že tam jsou hodnoty blízké nule a pak je tam část, kdy se tyto hodnoty mění velmi rychle do maximální a minimální hodnoty. Jenže stále není jasné, jestli se dá jednoduše poznat, který kanál matice S je právě ten špatný. V tomto případě pak k tomu, aby se nemusel hledat kanál podle vlastností, pomohla matice A.

(38)

37

Graf 20: Matice A reálného signálu

Z matice A je poznat, že 1. řádek, 1. sloupec má velmi vysokou hodnotu. Jedná se o zdaleka nejvyšší hodnotu v celém signálu. Této hodnoty jsem se pokusil zbavit tak, že jsem tuto pozici v matici A vynuloval.

Graf 21: Rekonstrukce reálného signálu

Z výsledku je viditelné, že byl výpadek nahrazen signálem, který by mohl být správný. Jestli se jedná skutečně o správný výsledek, není možné jednoduše určit. Aby se dalo rozpoznat, jestli je signál správný, tak by ho musel vidět nějaký doktor, který se o tématiku EEG signálů zajímá nebo s EEG přístrojem přímo pracuje.

(39)

38 4.5.3. Odstranění části matice S

Jelikož hodnota v matici A byla příliš vysoká, tak je jasné, že i hodnoty kolem nuly z matice S jsou poté ve výsledném signálu zastoupeny ve větší míře. Proto není nejlepší způsob nulovat přesně hodnotu na té pozici matice A. Bylo tedy lepší pro výsledek vynulovat jen tu špatnou část v matici S na 3. kanále.

Graf 22: Rekonstrukce reálného signálu č. 2

Po rekonstrukci ovšem příliš velký rozdíl vidět není. V tomto případě je lepší rovnou nulovat hodnotu v matici A, než se pokoušet najít přesnou délku toho špatného signálu, odkud začíná a kde přesně končí.

(40)

39

5. Výsledky

Pro všechna data bylo dobré zhodnotit, jestli se podařilo vylepšit SNR. Tedy jestli artefakt byl skutečně odstraněn. Měřit SNR bylo možné pouze na umělých artefaktech, kde se načtená data brala od začátku jako správný signál a artefakt byl dosazen uměle podle toho, jaký jsem chtěl použít. Proto se na těchto umělých artefaktech dalo zjistit SNR před provedením vyčištění signálu a poté se dalo zjistit SNR po vyčištění signálu. Toto nebylo možné pro reálná data s reálným artefaktem, protože tam se nedá správně zjistit SNR před provedením. Pouze se dá odhadovat, jestli byl odstraněn artefakt nebo ne. Jestli artefakt byl odstraněn správně, už se zjistit nedalo.

Pro každé měření SNR jsem vytvořil graf, který na konci ukazuje, jaké bylo zlepšení SNR po provedení vůči SNR před odstraněním artefaktů. Každý graf je použitý pro celý signál, který má 134 720 vzorků pro každý kanál. Signál má vzorkovací frekvenci 1000 Hz. Skládá se z deseti kanálů. Jedná se o záznam dlouhý přibližně 2 minuty a 15 vteřin.

Rámec, který jsem používal, měl 5000 vzorků. Jedná se tedy o 27 rámců. Počet pokusů je poté vysvětlen u jednotlivých vyhodnocení artefaktů. Jelikož u každého experimentu byl na jednom rámci proveden pokus čtyřikrát, tak celkově bylo vždy provedeno 108 pokusů. O jaké pokusy se jednalo, je vysvětleno u jednotlivých podkapitol.

5.1. Sinus 50 Hz

První byl přidán sinus 50 Hz. Sinus byl vložen vždy čtyřikrát pro jeden rámec signálu. Každý další pokus u jednoho rámce znamenal vyšší amplitudu sinusu. Tzn., že v prvním pokusu na jednom rámci byl nižší šum, než při druhém pokusu a nejvyšší šum byl při čtvrtém pokusu.

(41)

40

Graf 23: SNR vylepšení sinus

Z grafu vychází, že odstranění sinusu 50 Hz proběhlo vždy úspěšně. Pro nižší amplitudy sinusu byl SNR rozdíl větší, protože šum na začátku byl také větší, tedy se dala odstranit větší část šumu. Proto graf vychází tak, že první pokus pro jeden rámec má nižší SNR rozdíl než další pokusy pro tento rámec. Je vidět, že SNR rozdíl je minimálně kolem 25 dB.

5.2. Nulování signálu

Na každý rámec se několikrát použila jiná délka nulované části. První byla vždy část dlouhá 500 vzorků. Poté se přičetlo 500, až dokud nebyl výpadek dlouhý 2 000 vzorků. Takže na každý rámec se použilo nulování čtyřikrát. Celkově tedy bylo provedeno 108 pokusů, stejně jako u sinusu.

(42)

41

Graf 24: SNR nulování (500 a 1000 vzorků)

Graf zobrazuje SNR vylepšení pro jednotlivé použité metody. ICA1 znamená první metodu pro nulování s pomocí ICA. ICA1 metoda byla vysvětlena v kapitole 4.3.1. ICA2 znamená druhou metodu s pomocí ICA. ICA2 metoda byla vysvětlena v kapitole 4.3.2. Projekce je poté SNR u použití projekce, místo ICA.

Graf 25: SNR nulování (1500 až 2000 vzorků)

Z grafů lze vyčíst, že nejlepší je druhá metoda s použitím EFICA algoritmu.

Nejhorších výsledků dosáhla metoda s použitím projekce, která delší nulovanou část

(43)

42 nahradí hůře než kratší nulovanou část. Z výsledků je patrné, že je vždy lepší použít ICA algoritmus než použít pouze projekci. Projekce má výhodu v tom, že je vždy stoprocentní, ale zlepšení je maximálně kolem 10 dB. Použité metody s pomocí ICA algoritmu nejsou stoprocentní, protože ne vždy matice A má stejné předpoklady, jaké jsem použil k hledání špatné části. ICA metoda ne vždy odhalí správně vynulovanou část. Hlavně u výpadku dlouhého pouze 500 vzorků to bylo často poznat. Obě metody s použitím ICA ale mají úspěšnost přes 85 %. Z těchto výsledků tedy pro další použití byla využívána druhá metoda, kterou jsem použil, s pomocí ICA algoritmu. V těchto případech docházelo k tomu, že čím delší výpadek, tím lépe se dá rozpoznat. To ale platí jen do určité délky vůči délce rámce. Kdyby byl vynulován celý kanál v jednom rámci, tak už se s tím nedá udělat nic, protože ICA metoda signál s nulovaným kanálem nevyhodnotí, protože se v tu chvíli jedná o singulární matici.

U rozdílu SNR u nulování už není žádná část příliš odlišná v závislosti na šumu, i když v některých částech je výpadek delší. Děje se to proto, že se mění hodnota v matici A v závislosti na ostatních hodnotách dvou sloupců. Tzn., že ne vždy je průměr takový, že se podaří odstranit celý šum. U projekce bylo vidět, že čím delší byl výpadek, tím méně je projekce signálu účinná.

5.3. Realističtější výpadek

Pro realističtější výpadek byla použita metoda 2, kterou jsem použil u nulování.

Špatná část signálu byla vždy stejně dlouhá jako u nulování, tedy 500 až 2000 vzorků, které byly ovlivněny. Celkově bylo provedeno 108 pokusů. Kromě odstranění výpadku bylo třeba ještě zjistit, kde je špatný signál a ten nahradit. Tato metoda na vyhledání špatné části signálu fungovala z více jak 95 %. Z více jako 100 vzorků signálu nebyla špatná část nalezena maximálně třikrát, proto bylo jednoduché špatnou část vyhledat.

Ve výsledném grafu jsou započítány jen hodnoty SNR, pokud byla špatná část nalezena, protože pokud nebyla nalezena, tak neproběhl ani proces vynulování a odstranění vynulované části. V některých případech byla špatná část velmi podobná původní části, hlavně u kratších intervalů.

(44)

43

Graf 26: SNR realističtějšího výpadku

Graf ukazuje, že odstranění špatného signálu je úspěšné ve více jak 85 % případů, takže je vidět, že nulování se v tomto případě dá použít i s metodou, kterou jsem navrhl pro nalezení špatné části v matici A. Je patrné, že metoda funguje stejně jako u nulování lépe pro delší špatnou část, než pro kratší část. V grafu je i zanesena nenalezená špatná část (výsledek 0, protože SNR po je stejné jako SNR před), která čím je delší, tím lépe se vyhledá.

(45)

44

Závěr

Jak je vidět v předchozí kapitole, tak některé metody skutečně fungují velmi spolehlivě a pomocí ICA se tak dá dobře odhadnout artefakt, který v signálu nemá být.

Celková úspěšnost mnou použitých algoritmů se tak dostala nad 80 % s tím, že vždy by se dalo zjistit, proč vlastně tato metoda nefunguje správně.

Jednalo se o velmi náročné téma, které není příliš prozkoumáno, takže u skutečných artefaktů je těžké hodnotit, jestli výsledek je správný nebo ne. Aby se toto dalo zjistit správně, je potřeba tyto grafy ukázat někomu, kdo velmi dobře rozumí samotnému EEG signálu. Jelikož toto nebyl účel práce, tak za sebe mohu zhodnotit, že metoda na odstranění reálného artefaktu funguje.

Cílem práce bylo také provedení on-line nebo batch-online režimu. Už z popisu ICA algoritmu vyplývá, že používat přímo on-line režim je téměř nemožné, protože ICA algoritmus není jednoduchý a je také časově velmi náročný. Navíc je potřeba dlouhé vzorky signálu, aby se dal artefakt odstranit.

Pro batch-online je ICA algoritmus použitelný, ale musí se zvolit vhodný rámec, o který se bude signál posouvat, protože kdyby se posouval o příliš malou část, tak vznikne problém s tím, že by výsledek trval dlouho. Jelikož není příliš rozdíl mezi off-line režimem a batch-online režimem, tak provedený algoritmus na stejných vstupních datech byl použitelný i v batch-online režimu.

Do budoucna by určitě bylo vhodné rozšířit tuto práci na více artefaktů. Hlavně tedy na skutečné artefakty. Poté by bylo vhodné pokusit se také zjistit, jestli neexistuje jedna metoda na více artefaktů nebo jestli je potřeba pro každý artefakt používat různé metody pro nalezení.

Dále by bylo také dobré otestovat použité algoritmy na jiných biologických datech. Například EKG je vlastnostmi velmi odlišný signál, proto i za použití stejných ICA algoritmů a metod pro předzpracování signálu, může být řešení naprosto rozdílné.

Do budoucna by bylo také vhodné zkusit jiné metody porovnávání, aby se dalo ověřit, jestli je signál dobře zrekonstruován nebo ne. Kromě toho, že se dá z grafu výsledného signálu poznat, jestli došlo k lepší rekonstrukci, tak se dá zvolit i jiný postup než SNR.

(46)

45 Úspěšnost rekonstrukce signálu by se dala zjistit pomocí průměru výstupního vůči vstupnímu signálu v daném kanále, dále pak maximum, minimum, počet průchodů nulou. To vše dohromady. Dále by bylo možné použít frekvenční charakteristiku kanálu nebo také korelaci výstupního signálu vůči vstupnímu.

(47)

46 Seznam použité literatury

[1] Z. Koldovský, Poznámky k předmětu biologické a akustické signály, TUL, 2011 [2] O. Konopka, Semestrální práce – Analýza nezávislých komponent, ČVUT, 2004 [3] M. Funderák, Bakalářská práce - Implementace algoritmů slepé separace zdrojů

v jazyce C/C++, VUT v Brně, 2007

[4] M. Zima, P. Tichavský, K. Paul, V. Krajča, Robust removal of short duration artifacts in long neonatal EEG recordings using wavelet enhanced ICA and adaptive combining of tentative reconstructions, Physiological Measurement, vol. 33, no. 8, 2013.

[5] J. Hovorka, T. Nežádal, E. Herman, J. Praško, Klinická elektroencefalografie:

Základy klasifikace a interpretace, Maxdorf, 2003.

[6] P. Comon, C. Jutten Eds, Handbook of Blind Source Separation,

Independent Component Analysis and Applications, Academic Press, 2009 [7] Analýza hlavních komponent v problematice separace naslepo [online]. 2005.

Dostupné z WWW: http://www.elektrorevue.cz/clanky/05029/index.html [8] Elektroencefalogram [online]. 2014.

Dostupné z WWW: http://cs.wikipedia.org/wiki/Elektroencefalografie [9] MATLAB central [online]. 2014. Dostupné z WWW:

http://www.mathworks.com/matlabcentral

[10] Blind source separation [online]. 2014. Dostupné z WWW:

http://www.gol.ei.tum.de/index.php?id=27&L=1

[11] Z.Koldovský, P.Tichavský, E. Oja, Efficient Variant of Algorithm FastICA for Independent Component Analysis Attaining the Cramér-Rao Lower Bound, 2006 [12] L. Plevková, EEG Signály: X33BMI Úvod do biomedicínské informatiky, referát

ČVUT, 2005 Textové přílohy

Obsah přiloženého CD:

• Text bakalářské práce

o Bakalarska_prace_2014_Tomas_Grosman.pdf o Bakalarska_prace_2014_Tomas_Grosman.docx

o Kopie_zadani_bakalarska_prace_2014_Tomas_Grosman.pdf

• Zdrojové kódy

o Vše v programovacím jazyce MATLAB

References

Related documents

Pokud se rozhodneme pro nákup holí určených pro nordic walking musíme si předem ujasnit, jestli máme raději sportovní nebo rekreační chůzi, jestli budu hole používat pouze

Kvantitativní analýzou je myšleno určení množství nebo koncentrace složek v měřeném vzorku, které charakterizuje plocha píku. V dnešní době je plocha píku

Cílem pokládaných otázek první části dotazníku bylo zjistit, jestli se sexuální výchova vyučuje na dotazovaných středních školách, jestli jsou žáci spokojeny

Naznačte způsob vykazování čistých hodnot výnosů/nákladů ve Výkazu zisku a ztráty pojišťoven (zajišťoven) na příkladu těchto položek: a) zasloužené pojistné

Členky komise poté přednesly posudek vedoucí a oponentky práce, včetně podnětů k obhajobě, přičemž celá komise se shodla, že student na podněty z obou posudků reagoval již

169 lidí (76,5%), kterých se průzkumu účastnilo, nemusí kvůli své nemoci nosit speciální oblečení avšak 53 lidí (24,0%) musí nosit speciální oblečení,

Hodnocen´ı navrhovan´ e vedouc´ım bakal´ aˇ rsk´ e pr´ ace: výborně minus Hodnocen´ı navrhovan´ e oponentem bakal´ aˇ rsk´ e pr´ ace: výborně minus.. Pr˚ ubˇ eh

Tvorba licího rámu je velmi snadná a levná záležitost. Ve většině případu se rám sestává ze čtyř obvodových stěn a dna. Rám může být vyroben například z