• No results found

Taluppfattning av enstaviga ord i stationärt brus med och utan top-down stöd.

N/A
N/A
Protected

Academic year: 2021

Share "Taluppfattning av enstaviga ord i stationärt brus med och utan top-down stöd."

Copied!
20
0
0

Loading.... (view fulltext now)

Full text

(1)

stationärt brus med och utan top-down

stöd

Kandidatuppsats Johan Persson

johpe974@student.liu.se

Handledare: Örjan Dahlström Examinator: Magnus Bång Opponent: Frida Nilsson ISRN: LIU-IDA/KOGVET-G--12/021—SE

(2)
(3)

Teorier inom Kognitiv hörselvetenskap beskriver hur uppfattning av tal beror på två olika typer av processer. Bottom-up processer associeras med akustiska och fonetiska egenskaper hos en

inkommande signal och top-down processer associeras med lexikala, syntaktiska, semantiska samt kontextuella egenskaper. Förmågan att utnyttja top-down processer tros bero på kapaciteten hos arbetsminnet. För att undersöka en skillnad mellan bottom-up och top-down samt deras förhållande till arbetsminnet har ett Speech-in-Noise (SIN) test utformats och genomförts på 15 försöksdeltagare. Testet undersöker skillnader i tröskelvärden för att identifiera ett enstavigt ord i ett uppåtgående förhållande till stationärt brus, mot tröskelvärden för att identifiera ett enstavigt ord i stationärt brus med hjälp att top-down stöd. Top-down stöd ges i form av explicit priming och undersöks i både uppåtgående och nedåtgående förhållande till bruset. Två typer av arbetsminnestest, ”Letter Memory Test” och ”Reading Span Test”, användes för att undersöka en korrelation med differenser mellan tröskelvärdena. Resultaten visade på en signifikant skillnad mellan vanliga tröskelvärden och tröskelvärden då explicit top-down stöd används. Någon signifikant korrelation mellan kapaciteten hos arbetsminnet och differenserna dessa tröskelvärden fanns inte. Dock så fann analysen en signifikant korrelation mellan skillnad i tröskelvärden, för top-down stöd i uppåtgående och nedåtgående förhållande till brus, och ”Letter Memory Test”.

(4)

2 Bakgrund... 2

2.1 Tidigare utformade SIN test ... 2

2.1.1 Sentences for testing speech intelligibility in noise ... 2

2.1.2 Words in Noise test (WIN) ... 2

2.2 Ease of language understanding ... 3

2.3 Mål och Syfte ... 4

2.4 Frågeställning och hypoteser ... 5

3 Metod ... 6

3.1 Material ... 6

3.1.1 Reading span test ... 6

3.1.2 Letter memory test ... 6

3.1.3 Test av taluppfattning i brus... 6

3.2 Pilotstudie ... 8 3.3 Försöksdeltagare ... 8 3.4 Genomförande ... 8 3.5 Statistiska analysmetoder ... 9 4 Resultat ... 10 5 Diskussion ... 11 5.1 Resultatdiskussion ... 11 5.2 Metoddiskussion ... 12 6 Slutsats ... 13 7 Referenser ... 14

(5)

1

1 Inledning

På senare år har ett relativt nytt fält av vetenskap snabbt börja växa. Kognitiv hörselvetenskap (Cognitive hearing science) är ett tvärvetenskapligt område som har uppstått efter att forskare inom audiologi och kognitionsvetenskap börjat länka ihop de komplexa processerna som utgör hörseln. Tidigare låg fokus inom audiologin på bottom-up processer, dvs. de signaldrivna processer som relaterar till hörselsnäckan och de afferenta nervbanorna till cortex (hjärnbarken). Medans kognitionsvetenskapen la fokus på top-down processer, dvs. kognitivt drivna processer som symbolhantering och tolkning samt de efferenta nervbanorna. I och med uppväxten av Kognitiv hörselvetenskap har arbetet med att försöka sammanväva dessa olika typer av processer och dess interaktion samt formulera en hierarkisk struktur påbörjats.

Några av de starkaste inriktningarna i dagsläget inom fältet är: (1) Karaktärisering av

hörselnedsättning i förhållande till åldrandet och individuella skillnader i kognitiv kapacitet. Vilka kognitiva funktioner påverkas negativt av åldrandet och vilka är uthärdiga samt hur ser interaktionen mellan dessa ut? (Campbell et al., 2009). (2) Tidig hörselnedsättning i förhållande till kortikal och kognitiv plasticitet. Tidig hörselnedsättning är en hörselnedsättning som inte associeras med normalt åldrande. Begreppet plasticitet används för att beskriva hjärnans förmåga att förändras av tidigare erfarenheter (Purves et al., 2008). Medan kortikal plasticitet refererar till de fysiska förändringarna i cortex kan kognitiv plasticitet syfta till de kvalitativa förändringarna hos kognitiva processer. Inriktningen syftar alltså till att undersöka hur hjärnan påverkas av hörselnedsättning under utvecklingen. Det vill säga, vilka konsekvenser utanför talprocesser är möjliga och hur ser eventuell kompensation ut för en tidig hörselnedsättning? (Campbell et al., 2009). (3) Talets multimodalitet. I och med Kognitiv Hörselvetenskaps framsteg med teorier om top-down stöd inriktar sig studier nu även på synens roll, i form av kontextuella ledtrådar som exempelvis läppläsning, som understöd för talförståelse (Campbell et al., 2009).

En stor anledning till att detta fält av forskning fått ett starkt uppsving är behovet att förstå hur människor fungerar och presterar i mer ekologiska situationer (Arlinger et al. 2009). Hörselns yttersta funktion är i dagsläget att förstå tal. Det vanligaste klagomålet hos personer med nedsatt hörsel är i dagsläget att de kan höra en talare men inte förstå vad de säger (Wilson, 2003) och de tidiga tonaudiogramen (vanliga hörseltest) verkar inte längre optimala för att utvärdera den faktiska hörselförmågan.. Som resultat har flera olika typer av hörseltest uppkommit. Dessa test anses mer ekologiskt anpassade efter hörselns funktion då de använder sig av ord eller meningar i olika typer av maskerande ljud, som exempelvis brus eller distraherande tal.

(6)

2

2 Bakgrund

Kapitlet tar upp tidigare utformade SIN test som dels ligger till grund för studiens experimentella design samt tidigare forskning relaterat till typen av förhållande mellan bottom-up och top-down processer samt arbetsminnets roll i dessa processer. Avslutningsvis presenteras syftet med studien och frågeställningarna.

2.1 Tidigare utformade SIN test

I och med att en högre ekologisk validitet efterfrågats för att utvärdera en persons faktiska hörselnedsättning har en rad nya hörseltest uppkommit. Några av de vanligaste kommersiella ”speech-in-noise” (SIN) testen är ”the Quick Speech-in-Noise test” (QuickSIN), ”Bamford-Kowal-Bench Speech-in-noise” (BKB-SIN) och ”Hearing in Noise test” (HINT) (Killon et al., 2004, Niquette et al., 2003, Nilsson et al., 1994 se Wilson et al., 2007). Skillnader mellan dessa olika test kan variera. Det sistnämnda testet HINT, använder sig till skillnad från de andra två av en konstant nivå av brus (72 dB) medans nivån på meningarna varieras i förhållande till det (Nilsson et al., 1994). Samtidigt använder samtliga test sig av samma kriterier för tröskelvärden (speech reception threshold), vilket kan beskrivas som den nivån som krävs för att lyssnaren ska identifiera 50 procent av materialet (Wilson et al. 2007). Vidare består exempelvis HINT av 25 listor innehållandes 10 meningar styck tagna från samma material som BKB-SIN testet, fast omskrivna till amerikansk engelska (Nilsson et al., 1994). Utformningen på testen varierar alltså men inget av testen är utformade för att kunna undersöka skillnaden mellan de två olika typer av processer, top-down och bottom-up, som är inblandade i hörseln. En närmare beskrivning av utvecklingen av ett par av SIN testen som legat till grund för den aktuella experimentella designen följer.

2.1.1 Sentences for testing speech intelligibility in noise

Hagerman, 1982 utformade material för ett svenskt SIN test för att skapa ett passande kliniskt mått för tal förståelse i brus. En original lista med tio meningar innehållandes fem ord styck användes för att skapa 13 listor. De nya listorna skapades genom att slumpmässigt ta ut ord ur från de fem kolumnerna av de tio meningarna. Bruset skapades från ljuden av respektive lista och delades upp i sju delar för att sedan mixas så ingen uppdelning märktes. Resultatet blev ett spektralt innehåll liknande de av respektive ordlista. Bruset amplitud modulerades sedan för att undvika ett stationärt brus. Materialet testades på 20 försöksdeltagare mellan åldrarna 18-32 med ett medel på 26 år. Försöksdeltagarna testades på höger öra och fick verbalt repetera de uppfattade orden till

experimentledaren. Samtliga tröskelvärden mättes i nedåtgående gång och togs ut med kriteriet 50 procent rätt. Tröskelvärden tas ut i form av signal-brus förhållande (SNR; Speech to Noise Ratio). Talnivån låg konstant på 65 dB och bruset varierades med steg på 3 dB. Experimenten resulterades i tre medelvärden för tröskelvärden: SNR -7.13, -7.66 och -8.83 dB. Antal listor som användes per tröskelvärde är fyra, fyra respektive två. Reabiliteten bedöms så bra att tröskelvärden för enbart en lista kan användas för klinisk bedömning.

2.1.2 Words in Noise test (WIN)

Words in Noise test (WIN) har målet att vara ett kliniskt verktyg för att kvantifiera en lyssnares hörsel i form av ration mellan en signal och maskerare(S/B; Signal to Babble ratio) (Wilson, 2003). Några krav för testet var att det utvärderar ordigenkänning vid olika S/B ratios och att det ger ett lättolkat resultat. Testet skulle även vara tidseffektivt för att lättare kunna användas av audionomer.

Materialet som används är enstaviga ord som tidigare kliniskt använts vid ordigenkänning utan maskerare. 100 ord togs ut där 30 används som träningsomgång och de resterande 70 som

(7)

3

testomgång. Baserat på en pilotstudie har även varje ord fått en plats på en specifik nivå. Som maskerare har obegripligt bakgrundsprat valts då de ansågs ha störst ekologisk validitet. Bakgrundspratet består av tre kvinnor och fyra som för konversationer om diverse ämnen. Bakgrundspratet hålls på en konstant nivå på 70 dB medans två olika utformningar av nivåer för orden skapats. I den ena ligger spannet för ordnivåer inom -5-20 dB och för den andra -10-20 dB med 5 dB per steg för båda versionerna (Wilson, 2002). Senare har dock dessa S/B ratios ändrats till att gå från 0-24 dB med 4 dB steg (Wilson, 2003).

2.2 Ease of language understanding

Ease of language understanding (ELU) är en modell som försöker beskriva hur arbetsminnet underlättar vid språkförståelse. Närmare bestämt försöker den beskriva ett dynamiskt förhållande mellan implicita, bottom-up processer och explicita, top-down processer. Det är generellt sett att en oförvrängd och ren auditiv signal processeras snabbt, implicit och bottom-up för att tolka fonetiska egenskaper samt ge lexikal tillgång(se Fig. 1)(Stenfelt & Rönnberg, 2009).

Figur 1. En modell för top-down och bottom-up processer av en auditiv signal (modifierad modell av Edwards, 2007 se Stenfelt & Rönnberg, 2009)

När en signal blir förvrängd krävs det att en explicit top-down process sätts in för att tolka de

fonetiska egenskaperna. För att beskriva samspelet mellan de olika processerna har Rönnberg (2003) presenterat och vidareutvecklat (Rönnberg, 2008; Stenfelt & Rönnberg 2009) modellen ELU (se Fig. 2). Modellen gör vissa antaganden så som att kopplingen mellan en signal och kognition ligger under lexikal nivå, dvs. stavelser och fonologiska egenskaper. Modellen antar även att hastigheten för åtkomst till långtidsminnet är viktigt för tolkning av en signal samt att det finns en generell mekanism för inkoppling av explicita processer vid misspassning mot långtidsminnet(Rönnberg, 2003).

(8)

4

Modellen har betoning på fonologiska processer, interaktion med långtidsminnet och roller hos de implicita och explicita processerna (Stenfelt & Rönnberg 2009).

Figur 2. Arbetsminnessystem för ELU (Rönnberg et al., 2008)

Modellen beskriver hur multimodal information, fonologiska, semantiska och syntaktiska

egenskaper, tas in och processeras. Processen är snabb, automatisk och binder ihop informationen för att bilda fonologisk information (RAMBPHO; Rapid Automatic Multimodal Binding of PHOnology) som vid ”rena” förhållanden matchar de fonologiska egenskaperna med fonologiska

representationer i långtidsminnet för att ”låsa upp” långtidsminnet lexikon. Då förhållanden inte är optimala, exempelvis vid en förvrängd signal, och en misspassning sker mot långtidsminnet kopplas explicita top-down processer in. Dessa processer tar upp kapacitet hos arbetsminnet då de försöker antyda information som fonologiska, syntaktiska och semantiska egenskaper för att skapa förståelse (Rönnberg, 2008).

2.3 Mål och syfte

Målet med denna studie är att utöka tillgänglig information om bottom-up och top-down

processernas roll vid talförståelse samt undersöka eventuella kvalitativa skillnader hos arbetsminnet i förhållande till dessa processer.

Tidigare forskning har teoretiserat att top-down effekter underlättar vid talförståelse och kan sänka tröskelvärdet av uppfattat tal. Men hur skillnaden mellan bottom-up och top-down effekter ser ut har förbigåtts. Studiens syfte är därför att undersöka förhållandet mellan tröskelvärdena för top-down och bottom-up processering av en auditiv signal hos personer med normal hörsel. För att undersöka skillnaden mellan dessa tröskelvärden i en klinisk miljö med relativt stor kontroll men fortfarande lyckas behålla en viss ekologisk validitet, testas detta med enstaviga ord i olika

förhållanden till brus. Syftet sträcker sig även för att undersöka om dessa tröskelvärden korrelerar med kapaciteten hos arbetsminnet.

(9)

5

2.4 Frågeställning och hypoteser

Studien har två huvudsakliga frågeställningar:

1. Hur stor kommer en eventuell skillnad mellan tröskelvärden för bottom-up och top-down att vara för enstaviga ord i stationärt brus?

2. Finns det ett samband mellan arbetsminneskapacitet och skillnaden i förmåga att uppfatta tal i brus då högt eller lågt stöd av top-down processer används?

Hypotesen är att det finns betydande skillnader i hur tydlig signalen behöver vara då företrädesvis bottom-up processer används jämfört med då ökat stöd av top-down processer kan utnyttjas. Ytterligare en hypotes är att hög arbetsminneskapacitet hänger samman med stor skillnad i förmåga att uppfatta tal i brus då högt eller lågt stöd av top-down processer är möjliga.

(10)

6

3 Metod

3.1 Material

Experimentet och alla deltester utfördes på en bärbar PC tillsammans med ett par Sennheiser HDA 200 vadderade hörlurar, som kalibrerades att ge 65 dB vid 1 kHz.

3.1.1 Reading span test

För att utvärdera försöksdeltagarnas arbetsminneskapacitet användes ett ”reading span test”. ”Reading span test” är ett test som belastar både korttidsminnets processer och lagring av

information samtidigt (Daneman & Carpenter, 1980). Testet som använts är en svensk och förkortad version (Rönnberg, 1989) av original testet. Upplägget på testet var så att efter två övningsomgångar presenterades två sekvenser av två till fem meningar i uppåtgående ordning (totalt 30 inkl. 2

övningsomgångar). Meningarna presenterades ett ord i taget på datorskärmen där varje ord

presenterades i 0,8 sekunder och med ett uppehåll på 0,075 sekunder mellan varje ord. Meningarna som presenterades var hälften av kategorin absurda, exempelvis ”Räven skrev poesi”, och den andra hälften av kategorin normala, exempelvis ”Raketen åkte upp”. Försöksdeltagarna hade två uppgifter att utföra. Dels skulle de efter varje mening under en period på 1,75 sekunder avgöra om meningen var normal genom att svara ”ja” för normal och ”nej” om de uppfattande meningen som absurd. Denna uppgift syftar till att belasta arbetsminnets processer genom tolkning av information (Daneman & Carpenter, 1980). Försöksdeltagarna skulle även efter en sekvens av två till fem

meningar upprepa antingen de första eller sista orden från varje mening i sekventiell ordning. Denna uppgift syftar till att utvärdera arbetsminnets lagringsfunktion (Daneman & Carpenter, 1980). Rättning av testet görs enbart på den sistnämnda uppgiften och har ett maxpoäng på 28. 3.1.2 Letter memory test

“Letter memory test” är ett test för att utvärdera uppdateringsfunktionen av arbetsminnet (Miyake et al., 2000). Totalt sett 14 sekvenser (inkl. två övningssekvenser) av versala konsonanter

presenterades på en datorskärm. Sekvenserna bestod av antingen fem, sju, nio eller elva konsonanter som presenterades i slumpvis ordning där varje konsonant presenterades i två sekunder. Försöksdeltagarnas uppgift var att i slutet på varje sekvens upprepa de sista fyra presenterade konsonanterna i rätt ordning genom att skriva in dem på datorn. Poängsättning av testet görs i procent av korrekt upprepning av konsonanterna och ordning för varje sekvens. 3.1.3 Test av taluppfattning i brus

Testet av taluppfattning i brus består utav tre delar. Vid uppgifter med ordigenkännelse går det inte att undvika en viss effekt av top-down processer eftersom ord automatiskt triggar lexikal tillgång. Men då det var nödvändigt att använda samma material för att kunna göra en jämförelse mellan tröskelvärden var målet att minimera top-down effekter i Deltest ett samt att förstärka top-down effekter genom explicit priming i Deltest två och tre. Priming innebär att deltagare utsätts för stimuli, i den här studien ett enstavigt ord, som sedan påverkar processer och eventuellt utfall vid ytterligare stimuli.

Material för Deltest ett bestod av åtta målord som valts ut ur en tidigare framställd ordlista (Moradi et al., 2012). Orden var alla enstaviga substantiv och bestod av formen konsonant-vokal-konsonant-(konsonant). Inget av orden bildade ett ord baklänges och bestod därför av olika konsonanter på vardera sida av vokalen. Målorden hade alla ett frekvensvärde inom 20-100 i korpusen PAROLE

(11)

7

(http://spraakbanken.gu.se/parole/). Då tidigare forskning (Wilson et al., 2008) visat att [m]-ljud är svårare att uppfatta uteslöts ord innehållandes detta från målorden.

Utav de åtta målorden innehöll fyra en lång vokal och fyra en kort vokal. Inom gruppen lång vokal respektive kort vokal var vokalerna unika, dock återfanns samma vokal mellan grupperna. En lista med målorden skapades där vartannat ord innehöll lång vokal respektive kort vokal. För att skapa ytterligare balansering användes en pseudo randomisering av målordens ordning över de olika deltagarna. Detta gjordes genom att ordens ordning försköts ett så försökspersonens första målord blev andra försökspersonens sista, och så vidare. För att sedan undvika en eventuell sekvenseffekt inverterades även listan efter försöksperson åtta, så att försökspersonerna nio till 16 hade motsatt ordning på målorden jämfört med försökspersonerna ett till åtta.

För att genomföra del två och tre krävdes även listor med distraktionsord då försöksdeltagarna annars bara skulle kunna indikera när de hörde något och inte när de lyckats identifiera ett målord. Dessa distraktionslistor skapades genom att ta ut 16 distraktionsord med lång vokal respektive 16 med kort vokal inom frekvensen 18-110 i korpusen PAROLE.De totalt 32 uttagna distraktionsorden fick sedan bilda fyra distraktionslistor med lång och fyra distraktorlistor med kort vokal, var och en innehållandes fyra ord per lista. Resultatet blev två matriser, en för lång och en för kort vokal, med listornas innehåll i vertikal ordning (se Tabell 1).

Tabell 1. T.v. De fyra vertikala distraktorlistorna för lång vokal. T.h. för kort vokal.

V1 V2 V3 V4 V1 V2 V3 V4

bad lok säd nit tum sill lem däck

deg bod gap jos mått bom skägg vett

lin dal bår sjok barr skepp vidd buss mos rön sot bås mull biff fack nick

De två matriserna användes sedan för att skapa de tio nivåerna för varje målord. Distraktororden jämfördes med målorden och då distraktionsorden bedömdes vara för lika ett målord (när vokal och en konsonant överensstämde) korrigerades upplägget med att byta ut den aktuella listan med en alternativ lista. Per nivå presenteras ett målord fyra gånger tillsammans med en av

distraktionslistorna innehållandes fyra distraktionsord. För att undvika en eventuell effekt av mönster inom nivåerna skapades fem mönster av ordordningsföljd som innebar att de fyra målorden

återfanns 4-6 gånger per plats över nivåerna. Målorden presenterades inte heller mer än två i rad i dessa ordordningsföljder. För att undvika ytterligare effekter av mönster över nivåer och målord försköts ordningen med ett steg vid ett nytt målord för att sedan inverteras mellan vokalgruppernas målord samt att varannan gång en distraktorlista presenterades så inverterades den.

Inspelning av orden skedde i en studio utan eliminerat eko på en digital videokamera (Sony V1) med 48 kHz samplingsfrekvens. Mikrofonen var extern och placerad 60 cm från talaren som var en ung kvinna utan påtaglig dialekt och som hade tydlig artikulation. De inspelade orden lades sedan i separata ljudfiler som bestod av fem sekunders stationärt brus, där ordet presenterades slumpmässigt mellan sekund två till fyra.

(12)

8

3.2 Pilotstudie

Utifrån tre delexperiment i pilotstudien kortades experimentet ned till att bara använda fyra målord i varje deltest samt att minska ned antalet distraktorerna i varje nivå för Deltest två. Tre av orden som plockades bort gjordes så på grund av sin tvetydighet. De fyra målord (”Dop”, ”Kur”, ”Vik” och ”Bar”) som sedan blev utvalda gjordes så på kriteriet att de innehöll långa vokaler för att skapa homogenitet i materialet. Resultatet blev att målordet presenterades två gånger tillsammans med två

distraktorord på varje nivå i Deltest två. Experimentet som till en början tog två timmar att utföra har i och med korrigeringarna blivit cirka en timme. Pilotstudien resulterade även i identifiering av startnivåer i form av SNRs (Signal to Noise Ratio). Nivåerna som identifierades var för Deltest ett -12 dB, Deltest två -6 dB och för Deltest tre -18 dB. För Deltest två och tre var dock nivåerna preliminära då de kunde behövas justeras för att vara anpassade till individuella skillnader. För att identifiera startnivåerna användes tröskelvärdena från deltagarna i pilotstudien. Med rum för variation sattes startnivåerna cirka fem nivåer ifrån dessa tröskelvärden och med ett intervall på 2 dB mellan nivåerna.

3.3 Försöksdeltagare

Rekrytering av försöksdeltagare skedde enligt ett bekvämlighetsurval. Alla försöksdeltagare var studenter vid Linköpings Universitet. Studien utfördes på totalt 15 försöksdeltagare varav 10 var män och 5 kvinnor. Åldersspannet låg mellan 22-28 år med en medelålder på 24,67 år. Alla

försöksdeltagare uppskattade sin hörsel till normal.

3.4 Genomförande

Experimentet inleddes med att informera försöksdeltagarna om de etiska aspekterna, dvs.

informationskravet, samtyckeskravet, konfidentialitetskravet och nyttjandekravet. Försöksdeltagarna fick inför varje enskilt test specifik information. Hälften av försöksdeltagarna inledde med ett

”reading span test” och den andra hälften med ett ”letter memory test”. Information om de två testen presenterades på en datorskärm samt att förtydligande information tillades.

Försöksdeltagarna hade även tid för att ställa frågor inför de båda testen.

Inför huvudtestet lästes en kort text upp för försöksdeltagarna där de informerades om upplägget samt att mer information skulle tillkomma inför testets tre olika delar. Inför Deltest ett informerades försöksdeltagarna om att det gällde enstaviga ord i olika förhållanden till brus. Samt att de skulle repetera det uppfattade ordet tillsammans med en konfidensskattning på en fem-gradig likertskala där 1 var ”mycket osäker” och 5 ”mycket säker”. Samtliga ord och brus presenterades bilateralt för försöksdeltagarna i samtliga deltest. Bruset var stationärt som genom modifiering fått samma spektrala egenskaper som talet och presenterades på en konstant nivå av 65 dB. Målorden i Deltest ett började presenteras vid en SNR på -12 dB för att sedan trappas upp 2 dB per steg (se Fig. 3). Kriterier för avslut på Deltest ett var rapportering av rätt ord tillsammans med två efterföljande femmor på konfidensuppskattning.

Inför Deltest två informerades försöksdeltagarna om att det gällde enstaviga ord i olika förhållanden till brus och att de innan start skulle få veta vilket målord de skulle lyssna efter. De blev på så vis explicit primade innan start. De informerades också om att de presenterade orden nu skulle komma att presenteras i nedåtgående steg samt att det, förutom målord, skulle komma presenteras

distraktor ord. De blev dock informerade att de inte behövde identifiera distraktororden. Uppgiften för försöksdeltagarna var att urskilja när ett målord presenterades eller när ett distraktorord

(13)

9

presenterades genom att rapportera ”rätt” följt av en konfidensskattning respektive ”fel” följt av en konfidensskattning. Presentationsnivån startade vid en SNR på -6 dB med -2 dB/steg (se Fig. 3), bruset låg fortfarande på en konstant nivå av 65 dB. I varje enskild nivå presenterades målordet två gånger tillsammans med två distraktionsord. Kriterier för avslut var den första av två på varandra följande nivåer där ett målord eller de båda distraktororden rapporterades fel .

Figur 3. Signal-brus förhållanden (SNR; Signal to Noise Ratio) för de tio nivåerna inom samtliga deltest.

Inför Deltest tre informerades försöksdeltagarna om ett liknande upplägg som i Deltest två men att presentationsnivån började lågt för att stegvis öka. Uppgiften i deltestet var samma som i Deltest två och rapportering skedde likadant. Presentationsnivån startade för samtliga försöksdeltagare utom två vid en SNR på -18 dB (se Fig. 3). Undantagen startade vid en SNR på -22 dB efter en anpassning grundat på avslut i Deltest två. Stegen mellan nivåerna låg på 2 dB och var alltså uppåtgående samt att bruset låg konstant på 65 dB. I varje enskild nivå presenterades ett målord tillsammans med två distraktorord. Kriteriet för avslut var när samtliga ord inom en nivå rapporterades rätt och där även efterföljande nivå blev godkänd.

3.5 Statistiska analysmetoder

Analysmetoderna som använts i studien är en envägs ANOVA med inomgruppsdesign och Pearsons korrelations koefficient (Pearsons produktmomentkorrelationskoefficient). Envägs ANOVA med inomgruppsdesign är en variansanalys för beroende mätningar som använder sig av

medeldifferensen mellan mättillfällena (Heiman, 2001). En envägs ANOVA med inomgruppsdesign valdes att användas då upprepade mätningar utfördes på samtliga försöksdeltagare (Deltest 1, 2 och 3). Pearsons korrelations koefficient är ett av de vanligaste sätt att beskriva den linjära korrelationen mellan två variabler (Heiman, 2001). Korrelationen beskrivs genom att sätta ett värde på r mellan -1 och 1. På så vis indikeras förhållandet inte bara i styrka utan även riktning i korrelationen.

-30 -25 -20 -15 -10 -5 0 5 10 1 2 3 4 5 6 7 8 9 10 dB Nivå

SNRs

Deltest ett (1 målord per nivå)

Deltest två (1 målord (x2) + 2 distraktorord per nivå) Deltest tre (1 målord + 2 distraktorord per nivå)

(14)

10

4 Resultat

Deskriptiv statistik på tröskelvärden för de fyra målorden visas nedanför i tabell 1. Som förväntat visade en inomgrupps ANOVA signifikanta skillnader mellan tröskelvärden för samtliga målord. Målord ”Dop”: F(2,28) = 47.79, p =.036, partial η 2

= .77, Huynh-Feldt korrigerat ε = .77. Målord ”Kur”:

F(2,28) = 131.33, p = .036, partial η 2

= .90, Huynh-Feldt korrigerat = .77. Målord ”Vik”: F(2,28) = 43.11, p < .001, partial η 2 = .76. Målord ”Bar”: F(2,28) = 23.47, p < .001 partial η 2 = .76. Sidak post-hoc test visade på skillnader mellan Deltest ett och Deltest två samt mellan Deltest ett och Deltest tre för samtliga ord, men även en signifikant skillnad mellan Deltest två och Deltest tre för målorden ”Dop” (p = .042) och ”Vik” (p = .01).

Tabell 2. Deskriptiv statistik för tröskelvärden för respektive målord och testdel.

Deltest 1

Dop Kur Vik Bar Medel

Medelv. dB -2,53 -1,87 -5,47 -6,27 -4,03

SD 3,96 2,33 3,42 4,20 1,75

Deltest 2

Dop Kur Vik Bar Medel

Medelv. dB -13,60 -12,27 -13,87 -14,27 -13,50

SD 3,04 1,49 1,60 1,98 1,58

Deltest 3

Dop Kur Vik Bar Medel

Medelv. dB -11,07 -11,73 -11,47 -11,60 -11,47

SD 2,12 1,49 1,92 2,64 1,26

Figur 4. Letter memory resultat (%) angivna i förhållande till medeldifferensen för Deltest två och tre. För att undersöka om skillnader mellan tröskelvärdena för de olika deltesten korrelerade med arbetsminneskapaciteten utfördes Pearson korrelationstest. Analysen fann inga signifikanta korrelationer mellan skillnader i tröskelvärden, för Deltest ett och Deltest två, och ”reading span test”, r(13) = .08, p = .77, eller ”letter memory test”, r(13) = -.25 , p = .37. Inte heller för skillnader i tröskelvärden för Deltest ett och Deltest tre, varken i förhållande till ”reading span test”, r(13) = .20,

p = .48 ,eller till ”letter memory test”, r(13) = .14, p = .63. Dock så fanns en signifikant korrelation

mellan medeldifferensen, för Deltest två och Deltest tre, och ”letter memory test”, r(13) = .56, p = .028, men inte för ”reading span test” r(13) = .04, p = .89.

0 20 40 60 80 100 -7 -6 -5 -4 -3 -2 -1 0 1 Let te r M e m o ry ( % ) Medeldifferens (dB)

(15)

11

5 Diskussion

5.1 Resultatdiskussion

Speciellt intressant av analysen är den signifikanta korrelationen mellan medeldifferensen, för Deltest två och Deltest tre, och resultaten från ”letter memory test”. Tolkningen av detta, då ”letter memory test” utvärderar arbetsminnets uppdateringsförmåga (Miyake et al., 2000), är att

kapaciteten hos uppdateringsförmågan kan predicera förmågan att följa ett explicit primat nedåtgående ord mot förmågan att identifiera ett uppåtgående ord, som blivit explicit primat. En effektivare uppdateringsförmåga i arbetsminnet verkar alltså minska gapet mellan tröskelvärden för de två olika typerna av presentation. Där identifiering av ett uppåtgående ord, som blivit explicit primat, kan ske tidigare i förhållande till en individs tröskelvärde hos ett nedåtgående, explicit primat ord. Varför korrelerar då inte ”reading span test” på samma vis? Medans ”letter memory test” visar på uppdateringsförmåga, visar ”reading span test” på förmågan att tolka information och lagringen av information. Då ett uppåtgående ord jämförs med en representation av ordet genom

arbetsminnet enligt ELU modellen verkar det möjligt, efter de aktuella resultaten, att tolkning- och lagringskapacitet spelar mindre roll än kapaciteten hos uppdateringsförmågan för att korrigera och lyckas matcha det presenterade ordet mot dess representation.

I likhet med målorden ”Dop” och ”Vik” visade ett Sidak post-hoc test från ANOVA analysen för ”Bar” en näst intill signifikant skillnad mellan Deltest två och Deltest tre (p = .056). Anledningen till att målordet ”Kur” inte följde samma trend kan bero på ordets fonetiska egenskaper. McArdle & Wilson (2008) fann i sin analys av studien Wilson et al. (2008) att 45 procent av variansen av tröskelvärden för enstaviga ord kunde förklaras av de akustiska och fonetiska egenskaperna. Vilka fonem som skulle vara lätta respektive svåra att känna igen finns det dock motstridande resultat för (McArdle &

Wilson, 2008). I deras analys framkom det dock att konsonanter som föregick [ʉ] (utdraget /u/-fonem) fick högre träffsäkerhet. Trots att analysen är utförd på engelskt material och de tidigare motstridiga resultaten är det möjligt att målordet ”Kur” i den aktuella studien var lättare att urskilja på grund av fonemet [ʉ]. Därmed skulle det i så fall krävas mindre arbetsminneskapacitet för att identifiera det uppåtgående ordet ”Kur”, som blivit explicit primat i Deltest tre, vilket kan tänkas förklara avvikelsen från de resterande målorden.

Varför korrelerade inte skillnader i tröskelvärden mellan, Deltest ett och två respektive Deltest ett och tre, med arbetsminneskapaciteten hos försöksdeltagarna? Trots att enstaviga ord med dess akustiska, fonetiska och lexikala egenskaper aktiverar både bottom-up och top-down processer, är de oftast med sina akustiska och fonetiska egenskaper mer associerade med bottom-up processer (McArdle & Wilson, 2008; Stenfelt & Rönnberg, 2009). Detta tillsammans med det stationära brus, som till skillnad från exempelvis bakgrundsprat, inte involverar lika mycket top-down processer har förmodligen bidragit till en relativt låg belastning på arbetsminnet. Trots ett ökat top-down stöd, i form av explicit priming av målorden i Deltest två och tre verkar inte belastningen blivit tillräckligt stor för att finna en korrelation med kapaciteten på arbetsminnet. Försöksdeltagarnas uppgift verkar alltså inte varit tillräckligt krävande.

Ett resultat som skulle vara intressant att se är om inhibitionsförmågan hos försöksdeltagarna skulle korrelera med någon av differenserna mellan de olika deltesten. Då orden presenteras i stationärt brus är det möjligt att försöksdeltagare med en hög inhibitionsförmåga på ett effektivt sätt kan filtrera bort bruset tillräckligt mycket för att få lägre tröskelvärden. Detta skulle kunna testas med ett

(16)

12

Stroop-test (Stroop, 1935) där försöksdeltagare blir presenterade ord på färger som är färgade med andra färger. Uppgiften går ut på att återge färgen på orden och alltså inte orden i sig. Då läsning är en automatiserad process mäts inhibitionsförmågan genom att mäta skillnaden i reaktionstid mot när ord och färg överensstämmer.

5.2 Metoddiskussion

Inledningsvis var det tänkt att alla försöksdeltagare skulle få genomföra ett tonaudiogram för att fastställa att de hade en normal hörsel (≤20 db HL). På grund av tekniska komplikationer med programvaran gick dock dessa inte att genomföra. Istället frågades försöksdeltagarna att uppskatta sin hörsel (normal/inte normal). Detta kan ha påverkat studiens externa validitet.

I Wilson et al. (2008) konstateras det att en viktig del för ordigenkänning är det inspelade materialets egenskaper som till exempel dialekt hos talaren. Detta märktes också i den aktuella studien då flera av försöksdeltagarna tog upp detta under försöken. Problematiken som uppstod var just hur

långdragna de långa vokalerna var. Ännu en viktig aspekt att tänka på vid utformandet av material är tvetydigheten hos målorden. I det här fallet är målordet ”Bar” ett bra exempel. Majoriteten av försöksdeltagarna misstolkade i Deltest ett ”Bar” för ”Var”. Anledningarna till denna misstolkning är förmodligen dels på grund av dialektskillnader tillsammans med en tvetydighet. Det är möjligt att dialektskillnader utgör ett tillräckligt stort störningsmoment för att explicita top-down processer ska sättas in. Dessa processer kan sedan anpassa aktiveringsnivån för möjliga matchade ord efter frekvens (Luce & Pisoni, 1998). Då ”Bar” hade en frekvens på 99 i korpusen PAROLE medans ”Var” hade en frekvens på över 20000 är misstolkningen inte så överraskande. Detta är självklart

problematiskt för den interna validiteten men då alla analyser genomfördes en extra gång med ”Bar” exkluderat och inga signifikanser ändrades valdes ”Bar” att behållas. Problematiken gällde bara för Deltest ett vilket även var en motivering för att behålla ordet i analysen. Relaterat till dialekt hos talaren kan man i framtida studier variera olika inspelningar av samma ord med samma talare. Detta skulle leda till en minskning av igenkänningsledtrådar, vilket skulle försvåra deltagarnas uppgift och öka belastning på arbetsminnet. Genom att variera olika inspelningar skulle även påverkningar av dialekt hos talaren för deltagare till viss mån balanseras ut.

Ett problem vid upprepade mätningar är effekter av ordningen av dessa mätningar. Detta försöktes i den aktuella studien internt balanseras bort med en pseudo-randomisering av ordens

presentationsordning inom de olika deltesterna. Men på grund av studiens natur kunde inte ordningen av deltesten varieras då orden som ingick i studien inte fick vara tidigare kända för deltagarna i Deltest ett. Detta kan eventuellt resulterat i att tröskelvärden i Deltest ett avviker från försöksdeltagarnas faktiska tröskelvärden då försöksdeltagarna inledningsvis måste anpassa sig de nya lyssningsförhållandena. För att lösa detta problem skulle man kunnat inkorporera en

övningsomgång med ett nytt set av ord men då längden på experimentet var en begränsande faktor uteslöts detta.

(17)

13

6 Slutsats

Resultaten från studien visar som förväntat på en signifikant skillnad i tröskelvärden mellan processer med eller utan top-down stöd för taluppfattning i brus. Resultaten visade inte att storleken på denna skillnad är korrelerad med arbetsminneskapaciteten. Dock beror detta förmodligen på att uppgiften inte var tillräckligt krävande, vilket stödjer tidigare resultat att enstaviga ord oftast associeras med bottom-up processer (McArdle & Wilson, 2008; Stenfelt & Rönnberg, 2009). Den signifikanta korrelationen mellan medeldifferensen, för Deltest två och Deltest tre, och resultaten från ”letter memory test” antyder att uppdateringsfunktionen i arbetsminnet är relaterad till förmågan att matcha en inkommande signal med fonetiska egenskaper mot en representation i långtidsminnet, vilket stödjer ELU-modellen (Rönnberg, 2003; Rönnberg, 2008; Stenfelt & Rönnberg 2009).

(18)

14

7 Referenser

Arlinger, S., Lunner, T., Lyxell, B., Pichora-Fuller, M. K. (2009). The emergence of Cognitive Hearing

Science. Scand J Psychol 50:371-384.

Campbell, R., Rudner, M., Rönnberg, J. (2009). Editorial. Scand J Psychol 50:367-369.

Daneman, M. & Carpenter, P. A. (1980). Individual differences in working memory and reading. Journal of Verbal Learning & Verbal Behavior, 19, 450–466.

Edwards, B. (2007). The future of hearing aid technology. Trends in Amplification, 11, 31-45. Hagerman, B. (1982). Sentences for testing speech intelligibility in noise. Scand Audiol 11:79-87. Heiman, G. W. (2001). Understanding research methods and statistics: An integrated introduction for psychology. 2nd edition.

Killon, M. C., Niquette, P. A., Gudmundsen, G. I., Revit, L. J., Banerjee, S. (2004). Development of a

quick speech-in- noise test for measuring signal-to-noise ratio loss in normal-hearing and hearing-impaired listeners. The Journal of Acoustical Society of America, 116, 2395-2405.

Luce, P. A. & Pisoni, D. A. (1998). Recognising spoken words: The neighbourhood activation model. Ear and Hearing, 19, 1–36.

Miyake, A., Friedman, N. P., Emerson, M. J., Witzki, A. H., Howerter, A. (2000). The unity and diversity

of executive functions and their contributions to complex ‘‘frontal lobe’’ tasks: A latent variable analysis. Cognitive Psychology 40:49-100

McArdle, R., Wilson, R. H. (2008). Predicting word-recognition performance in noise by young

listeners with normal hearing using acoustic, phonetic and lexical variables. J Am Acad Audiol

19(6):507-518

Moradi, S., Lidestam, B., Saremi, A., & Rönnberg, J. (2012). Working memory and attention facilitate

identification of consonants and words in noise. Manuscript submitted for publication.

Nilsson, M., Soli, S., Sullivan, J. (1994). Development of the Hearing in Noise Test for the measurement

of speech reception thresholds in quiet and in noise. J Acoust Soc Am 95:1085–1099.

Niquette, P., Arcaroli, J., Revit, L., Parkinson, A., Staller, S., Skinner, M., Killon, M. (2003).

Development of the BKB-SIN test. Paper presented at the annual meeting of the American Auditory

Society, Scottsdale, AZ.

Purves, D., Brannon, E. M., Cabeza, R., Huettel, S. A., LaBar, K. S., Platt, M. L., Woldorff, M. G. (2008).

Principles of Cognitive Neuroscience.

Rönnberg, J. (2003). Cognition in the hearing impaired and deaf as a bridge between signal and

dialogue: a framework and a model. International Journal of Audiology, 42(Suppl. 1), 68–76.

Rönnberg, J., Rudner, M., Foo, C. & Lunner, T. (2008). Cognition counts: A working memory system for

(19)

15

Stenfelt, S. & Rönnberg, J. (2009) The Signal-Cognition interface: Interactions between degraded

auditory signals and cognitive processes. Scand J Psychol 50: 385-393.

Wilson, R. H. (2003). Development of a speech-i- multitalker-babble paradigm to assess

word-recognition performance. J Am Acad Audiol 14:453-470.

Wilson, R. H., McArdle, R. A., Smith, S. L. (2007). An evaluation of the BKB-SIN, HINT, Quick-SIN and

WIN materials on listeners with normal hearing and listeners with hearing loss. Journal of Speech,

Language and Hearing Research 50:844-856

Wilson, R.H., McArdle, R., Roberts, H. (2008) A comparison of recognition performances in

speech-spectrum noise by listeners with normal hearing on PB-50, CID W-22, NU-6, W-1 spondaic words, and monosyllabic digits spoken by the same speaker. J Am Acad Audiol 19(6):496–506.

(20)

Upphovsrätt

Detta dokument hålls tillgängligt på Internet – eller dess framtida ersättare –från

publiceringsdatum under förutsättning att inga extraordinära omständigheter

uppstår.

Tillgång till dokumentet innebär tillstånd för var och en att läsa, ladda ner,

skriva ut enstaka kopior för enskilt bruk och att använda det oförändrat för

icke-kommersiell forskning och för undervisning. Överföring av upphovsrätten vid

en senare tidpunkt kan inte upphäva detta tillstånd. All annan användning av

dokumentet kräver upphovsmannens medgivande. För att garantera äktheten,

säkerheten och tillgängligheten finns lösningar av teknisk och administrativ art.

Upphovsmannens ideella rätt innefattar rätt att bli nämnd som upphovsman i

den omfattning som god sed kräver vid användning av dokumentet på ovan

be-skrivna sätt samt skydd mot att dokumentet ändras eller presenteras i sådan form

eller i sådant sammanhang som är kränkande för upphovsmannens litterära eller

konstnärliga anseende eller egenart.

För ytterligare information om Linköping University Electronic Press se

för-lagets hemsida

http://www.ep.liu.se/

Copyright

The publishers will keep this document online on the Internet – or its possible

replacement –from the date of publication barring exceptional circumstances.

The online availability of the document implies permanent permission for

anyone to read, to download, or to print out single copies for his/hers own use

and to use it unchanged for non-commercial research and educational purpose.

Subsequent transfers of copyright cannot revoke this permission. All other uses

of the document are conditional upon the consent of the copyright owner. The

publisher has taken technical and administrative measures to assure authenticity,

security and accessibility.

According to intellectual property law the author has the right to be

mentioned when his/her work is accessed as described above and to be protected

against infringement.

For additional information about the Linköping University Electronic Press

and its procedures for publication and for assurance of document integrity,

please refer to its www home page:

http://www.ep.liu.se/.

References

Related documents

Även om jag i denna uppsats koncentrerat mig på specifikt hur personer med dyslexi hanterar skriftlig information i vardagslivet så kan så klart även ”normalläsare” ha erfarenhet

I resultatet framgår att lärarna har en gemensam syn på individanpassad undervisning, att undervisningen ska anpassas efter den enskilda elevens behov samt att arbetsmetod och

Resultatet om när elaka kommentarer förekommer kan knytas an till resonemanget som Svaleryd (2002), Davies (2003) skriver om att flickor inte får ta lika mycket plats som pojkar

Män som arbetar i kvinnodominerade yrken ska inte bara göra samma uppgifter som sina kvinnliga kollegor, utan förväntas även göra sådant som kvinnor normalt

Här kan man som lärare naturligtvis inte komma och kräva att de ska läsa för sina barn, men som lärare skulle man kanske kunna uppmuntra föräldrarna att köpa eller gå

Majoriteten av informanterna anser att det inte finns tillräcklig hjälp att tillgå för män som utsätts för våld i nära relationer och studien visar att de alla hänvisar dessa

Hon menar att det är viktigt att undersöka anledningarna till detta, men anser det inte vara en uppgift för KAST då de personer som söker sig dit faktiskt upplever sig ha ett

En annan skillnad är att man inte kan ge direkt respons under tiden någon formulerar sitt yttrande på hemsidan (i alla fall inte i detta chattformat). Dessa skillnader tycker