• No results found

Interaktionskvalitet - hur mäts det?

N/A
N/A
Protected

Academic year: 2021

Share "Interaktionskvalitet - hur mäts det?"

Copied!
40
0
0

Loading.... (view fulltext now)

Full text

(1)

Malmö Högskola Datavetenskap 75-90 hp vt 2009 Centrum för teknikstudier Examensarbete på C-nivå 15 hp Informationsarkitektprogrammet 180 hp

Interaktionskvalitet

Hur mäts det?

Interaction quality

How to measure it?

Författare: Annika Friberg

annika.friberg85@gmail.com

(2)

”Measures are the gears and cogs that make empirical research

efforts run. No empirical study can be better than its selected

measures.”

Barry H. Kantowitz, 1992

Sammanfattning

Den tekniska utvecklingen har lett till att massiva mängder av information sänds, i höga hastigheter. Detta flöde måste vi lära oss att hantera. För att maximera nyttan av de nya teknikerna och undkomma de problem som detta enorma informationsflöde bär med sig, bör interaktionskvalitet studeras. Vi måste anpassa gränssnitt efter användaren eftersom denne inte har möjlighet att anpassa sig till, och sortera i för stora informationsmängder. Vi måste utveckla system som gör människan mer effektiv vid användande av gränssnitt.

För att anpassa gränssnitten efter användarens behov och begränsningar krävs kunskaper om den mänskliga kognitionen. När kognitiv belastning studeras är det viktigt att en så flexibel, lättillgänglig och icke-påträngande teknik som möjligt används för att få objektiva mätresultat, samtidigt som pålitligheten är av största vikt. För att kunna designa gränssnitt med hög interaktionskvalitet krävs en teknik att utvärdera dessa. Målet med uppsatsen är att fastställa en mätmetod väl lämpad för mätning av interaktionskvalitet.

För mätning av interaktionskvalitet rekommenderas en kombinering av subjektiva och fysiologiska mätmetoder, detta innefattar en kombination av Functional near-infrared

specroscopy; en fysiologisk mätmetod som mäter hjärnaktiviteten med hjälp av ljuskällor och detektorer som fästs på frontalloben, Electrodermal activity; en fysiologisk mätmetod som mäter hjärnaktiviteten med hjälp av elektroder som fästs över skalpen och NASA task load

index; en subjektiv, multidimensionell mätmetod som bygger på kortsortering och mäter

uppfattad kognitiv belastning i en sammanhängande skala. Mätning med hjälp av dessa metoder kan resultera i en ökad interaktionskvalitet i interaktiva, fysiska och digitala gränssnitt. En uppskattning av interaktionskvalitet kan bidra till att fel vid interaktion minimeras, vilket innebär en förbättring av användares upplevelse vid interaktion.

(3)

Abstract

Technical developments have led to the broadcasting of massive amounts of information, at high velocities. We must learn to handle this flow. To maximize the benefits of new

technologies and avoid the problems that this immense information flow brings, interaction quality should be studied. We must adjust interfaces to the user because the user does not have the ability to adapt and sort overly large amounts of information. We must develop systems that make the human more efficient when using interfaces.

To adjust the interfaces to the user needs and limitations, knowledge about human cognitive processes is required. When cognitive workload is studied it is important that a flexible, easily accessed and non assertive technique is used to get unbiased results. At the same time reliability is of great importance. To design interfaces with high interaction quality, a technique to evaluate these is required. The aim of this paper is to establish a method that is well suited for measurement of interaction quality.

When measuring interaction quality, a combination of subjective and physiological methods is recommended. This comprises a combination of Functional near-infrared

spectroscopy; a physiological measurement which measures brain activity using light sources and detectors placed on the frontal lobe, Electrodermal activity; a physiological measurement which measures brain activity using electrodes placed over the scalp and NASA task load

index; a subjective, multidimensional measurement based on card sorting and measures the individual perceived cognitive workload on a continuum scale. Measuring with these methods can result in an increase in interaction quality in interactive, physical and digital interfaces. An estimation of interaction quality can contribute to eliminate interaction errors, thus improving the user’s interaction experience.

(4)

Tillkännagivande

Tack till; Johan Friberg, Doktorand, Fysiska institutionen, avd kärnfysik. Lunds Universitet, för stöd vid tolkning av fysiologiska mätmetoder för att säkerställa en korrekt tolkning av dessa; Agnets Gulz, Docent, Filosofiska institutionen, avd. kognition, Lunds Universitet, för inspiration och vägledning; Jana Holzanova, Docent, Filosofiska institutionen, avd. kognition, Lunds Universitet för bekräftelse att interaktionskvalitet är ett begrepp som ännu inte

definierats samt för ett inledande artikelförslag; Bengt J Nilsson, Professor i datavetenskap, Centrum för teknikstudier, Malmö Högskola för inspiration och handledning.

(5)

Innehåll

1 Introduktion………s 7 1.1 Syfte och frågeställning……….…s 7 1.2 Begreppsdefinition………....s 7 1.2.1 Interaktion………...s 7 1.2.2 Kommunikation………...s 8 1.2.3 Vad är interaktionskvalitet?...s 8 1.3 Vikten av att studera kommunikation tillsammans med interaktion ………....s 8 1.4 Disposition………..…..s 9 1.5 Ordlista………..s 9 2 Bakgrund………...s 9 2.1 Interaktionskvalitet………..s 10 2.2 Kommunikation……….……… s 10

2.2.1Ansikte – mot – ansikte och Teknikstödd kommunikation………..s 11

2.2.2 Interaktivitet………...s 11 2.2.3 Tid……….s 12 2.2.4 Förmedling………...….s 12 2.2.5 Ansikte – mot – ansikte vs Teknikstödd kommunikation………..s 13 2.3 Arbetsbelastning……….s 13 2.3.1 Kognitiv belastning………...s 13 2.3.1.1 Mätning………...s 14 2.3.1.2 Påverkan………..…s 15 1.3.1.3 Kognitiv belastning och interaktion………s 15 3 Mätmetoder………..…s 16 3.1 Fysiologiska mätmetoder………..s 16 3.1.1 Heart rate variability………..s 17 3.1.2 Skin conductivity response………s 18 3.1.3 Pupil dilation………..s 19 3.1.4 Electroencephalography ………s 21 3.1.5 Functional near- infrared spectroscopy………..s 22 3.2 Subjektiva mätmetoder………s 23 3.2.1 Subjective workload assesment technique……….s 24 3.2.2 NASA task load index………...s 25 3.2.3 Modified Cooper –Harper Scale………s 28 4 Analys………..s 29

4.1 Jämförelse av subjektiva mätmetoder……….s 30

4.1.1 Sensitivity………..s 30 4.1.2 Limited intrusiveness……….s 30

(6)

4.1.3 Diagnosticity………..s 30 4.1.4 Global sensitivity………...s 31 4.1.5 Transferability………s 31 4.1.6 Ease of implementation……….s 31 4.1.7 Slutsats subjektiva metoder………...s 32 4.2 Jämförelse av fysiologiska mätmetoder………...s 32 4.2.1 Sensitivity………..s 32 4.2.2 Limited intrusiveness……….…s 33 4.2.3 Diagnosticity………..s 33 4.2.4 Global sensitivity………...s 34 4.2.5 Transferability………s 34 4.2.6 Ease of implementation……….s 35 4.2.7 Slutsats fysiologiska metoder……….…s 35 5 Slutsats……….s 35 6 Referenser………s 38

(7)

1

Introduktion

Frågan vad interaktionskvalitet är har ännu inte definierats i litteraturen. Tittar man närmare på hur kommunikation brukar förlöpa kan man dock sluta sig indirekt till vissa slutsatser. Vi har letat i källor efter sådana indirekta slutsatser och valt att bygga en grund genom att först ta upp ämnet kommunikation i undersökningen av hur man mäter interaktionskvalitet. Som måttenhet används kognitiv arbetsbelastning och metoder har valts därefter.

1.1 Syfte och frågeställning

Uppsatsen bygger på frågeställningen ”Hur mäts interaktionskvalitet?” Syftet är att finna ett mått på interaktion som kan användas för att avgöra huruvida en sådan är effektiv eller ej, d.v.s. hur bra kvaliteten är. Målet är att mätmetoden ska innefatta en uppskattning av nivåer av interaktionskvalitet. Utefter detta mått ska det sedan gå att undersöka om en artefakt bör förbättras eller ej samt ge indikationer till hur förbättringar kan ske. Därtill ska mätmetoden kunna tillämpas universellt, d.v.s. i alla former av interaktion och kommunikation, via samtliga medier.

Mätmetoder inom två spår kommer att studeras; subjektivt respektive fysiologiskt, för att undersöka vilken av dem som är att föredra, om de är pålitliga samt i vilka situationer de är bäst lämpade. Syftet med uppsatsen är att ta fram ett förslag på hur man kan mäta

interaktionskvalitet.

1.2 Begreppsdefinition

1.2.1 Interaktion

Enligt Nationalencyklopedin (NE) är interaktion samverkan och samspel; en process där grupper eller individer genom sitt handlande ömsesidigt påverkar varandra. Påverkan kan förmedlas via språk, gester, symboler etc. (NE.se, 2009-07-13)

Wikipedia beskriver begreppet likartat och förklarar att det även kan förekomma mellan människa och maskin där interaktionen i stället sker via ett användargränssnitt. (Wikipedia.se, 2009-07-13) Det är det som är skillnaden mellan ansikte – mot ansikte och teknikstödd

(8)

1.2.2 Kommunikation

Enligt NE är kommunikation överföring av information mellan människor, djur, växter eller apparater. Kommunikation kräver ett språk eller en kod (språk, gester, symboler) vari informationen uttrycks samt ett fysiskt medium vari informationen överförs. Detta kan ske verbalt eller ickeverbalt. Prosodi och gester används för att komplettera och nyansera informationen. Man skiljer på avsiktlig och oavsiktlig kommunikation. Den oavsiktliga kommunikationen överförs omedvetet, ofta genom kroppsspråk. (NE.se, 2009-07-13)

I Wikipedia beskrivs en kommunikativ modell: Information kodas av en sändare och vidarebefordras via en kanal (tal, skrift, kroppsspråk) eller ett medium (brev, mail, sms) till en mottagare som avkodar denna information och sänder en respons till mottagaren. Denna överföring kan ske ansikte – mot ansikte eller via ett elektroniskt medium. Deltagarna, d.v.s., sändare och mottagare har ofta en överenskommelse med ett gemensamt mål för

kommunikationen. (Wikipedia.se, 2009-07-13)

1.2.3 Vad är interaktionskvalitet?

Som ovan nämnt är definitionen av interaktionskvalitet ännu inte fastställd. Utifrån kunskap om kommunikation och interaktion och vad kvalitet innebär har vi formulerat en betydelse för detta begrepp. Med interaktionskvalitet menar vi ett mått på hur effektiv en interaktion är - ju effektivare kommunikation desto högre interaktionskvalitet.En effektiv interaktion är en interaktion som kan ske med så lite energiåtgång som möjligt. I ett gränssnitt skulle detta innebära hur fort individen lär sig att använda det (tidsåtgång, antal fel, frustration etc).

Interaktion kan ske människa – människa, människa – ”digitalt eller fysiskt gränssnitt”. Det som påverkar interaktionskvaliteten är informationens omfattning, hur den presenteras och överförs.

1.3 Vikten av att studera kommunikation tillsammans med interaktion

En interaktion är beroende av kommunikation. Den genomförs i ett kommunikativt syfte; åtkomst, eller förmedling av information. Därför är det viktigt att studera

informationsöverföring. Hur väl informationen är förpackad och överförd avgör hur effektivt interaktionen kommer att ske, därför påverkar kommunikationen interaktionskvaliteten.

För att en interaktion ska fungera effektivt krävs återkoppling, vilket är en del i

växelverkan och är en form av information. Man kan säga att interaktion och kommunikation existerar i symbios.

(9)

1.4 Disposition

Uppsatsen inleds med att ge en bakgrund till interaktionskvalitet och hur kommunikation kan förlöpa, vilka olika former av kommunikation det finns och genom vilka medier de kan ske. Denna del handlar också om att definiera ett mått som kan användas vid mätning av

interaktionskvalitet. Nästa steg är att introducera olika mätmetoder och undersöka om de är pålitliga, i vilka situationer de är bäst lämpade etc. Vi kommer att lyfta fram fem fysiologiska respektive tre subjektiva mätmetoder. Uppsatsen avslutas med en diskussion kring vilken eller vilka av mätmetoderna som är att föredra vid mätning av interaktionskvalitet. En av dessa alternativt en kombination av flera kommer att rekommenderas.

1.5 Ordlista

Eye tracker – Instrument som mäter ögonaktivitet Fonetiskt – uttal

Hjärnbarken – yttre skiktet på storhjärnan Ickeverbal kommunikation - t.ex. kroppsspråk Invasivt – innefattar ett kirurgiskt ingrepp

Prosodi - rytm och melodi (NE.se, Kommunikation)

Spatial – Rum (som har att göra med utsträckning i rummet) Temporal – tidsbisats

Verbal kommunikation – tal och skrift (NE.se, Kommunikation)

2. Bakgrund

Interaktionskvalitet är ett nytt begrepp, denna del inleds med en kort översikt.För att förstå sig på interaktionens villkor bör man ha kunskap om kommunikation i olika former. Delen innefattar därför ett avsnitt om kommunikation.

2.1 Interaktionskvalitet

Att mäta interaktionskvalitet innebär att undersöka hur väl kommunikation genom och med artefakter (gränssnitt) fungerar. Det handlar om hur väl informationsöverföringen fungerar – från individen, genom mediet, tills en påverkan sker samt om önskad påverkan skett, alltså händelseförloppet från handling till respons. Detta kan mätas på flera sätt, alltifrån hur lång

(10)

tid det tar, antal fel som uppstår, till en subjektiv uppfattning eller en fysisk reaktion. Det medium som används kan vara ett digitalt eller fysiskt gränssnitt.

Syftet med mätning av interaktionskvalitet är att ta reda på om individen kan utföra en uppgift med rimlig energiåtgång samt om den sker korrekt. Detta kan innebära att studera en individ kommunicera något till en annan eller utföra en arbetsuppgift. I de fall

interaktionskvaliteten är bristfällig kan det bero på att individen har svårt att finna den

information som krävs för att utföra uppgiften, vilket då kan bero på ett informationsöverflöd eller spatiala felplaceringar. Vi människor har svårt att sortera i stora informationsmängder, för mycket information eller felplacerade element i ett gränssnitt kan göra att vi inte finner den information vi letar efter inom rimlig tid eller energiåtgång. En låg kvalitet kan även bero på att individen har sekundära uppgifter som utförs i samband med den primära uppgiften, eller yttre påverkningar som belastar sinnena.

Människan kan ta in en begränsad mängd information, om information når individen från flera kanaler, eller sinnen påverkar det denne när en uppgift utförs. Denna påverkan kan vara positiv då informationsmängden är lagom och relevant, eller negativ då informationsmängden är överväldigande eller irrelevant. Vid en negativ påverkan sker en kognitiv överbelastning, vilket resulterar i brister i interaktionen; den tar för lång tid eller det uppstår fel.

2.2 Kommunikation

De senaste 50 åren har det skett en stor teknisk utveckling som gett oss helt nya möjligheter att kommunicera på helt nya villkor. De nya medier som utvecklats har gett oss nya sätt att överföra information. Dessa har olika kvaliteter för olika syften. Dessa kvaliteter påverkar interaktionen. Numera kommunicerar vi inte bara via maskiner, utan med dem. (Holsanova & Gärdenfors, 2008) Det är därför viktigt att veta hur människor kommunicerar och använda denna kunskap vid utveckling av interaktiva artefakter.

Den dominerande metaforen för information är att den överförs från sändare till

mottagare. Information förpackas i koder som talat språk, gester, mimik, skriftspråk, bilder, symboler, former etc. och överförs till mottagaren via ett medium som kan vara fysiskt eller digitalt. Sändaren förväntar sig återkoppling från mottagaren. I de fall hinder uppstår i informationsöverföringen mellan sändare och mottagare sker en fördröjning i överföringen eller uppstår fel i informationen eller tolkningen av den (se figur 1). (Holsanova &

(11)

2.2.1 Ansikte – mot – ansikte och teknikstödd kommunikation

Vid samtal ansikte – mot ansikte sker ögonkontakt, vilket är en essentiell del i ett samtal då det stödjer förståelsen. Ögonkontakt är väsentlig för turtagning och återkoppling i samtalet. Andra viktiga delar vid denna kommunikationsform är tonfall, rytm och betoning. De bidrar till innehållet i ett talat samtal och understryker viktig information. Vid kommunikation ansikte – mot ansikte används även visuella koder som kroppsspråk och konstruktion av bilder (Holsanova & Gärdenfors, 2008).

Ansikte – mot ansikte kommunikation låter oss ta in information genom flera sinnen, främst visuellt och auditivt, men även lukt, smak och känsel kan ge oss en uppfattning om miljön vi interagerar i. Teknikstödd kommunikation är medierad, vilket innebär att den sker via ett medium som t.ex. kan vara en mobiltelefon eller en dator. Holsanova och Gärdenfors (2008) menar att den viktigaste skillnaden mellan dialog och medierad dialog är att

samtalsdeltagarna inte behöver befinna sig inom hör- och synhåll för varandra i den medierade. (Holsanova och Gärdenfors, 2008) Detta ger flexiblare kommunikativa villkor.

2.2.2 Interaktivitet

Jensen om interaktivitet:

Interaktiviteten hos en kommunikationsform kan definieras som möjligheterna för mottagaren att påverka innehållet (eller utformningen) av den fortsatta kommunikationen. (Jensen, 1998)

Figur 1

(12)

Då det sker en kognitiv överbelastning minskar individens möjlighet att påverka innehållet; interaktionskvaliteten är bristfällig.

Ett vanligt samtal är direkt interaktivt då sändare och mottagare omedelbart kan reagera på varandra, vilket innebär att de har en stor möjlighet att påverka vad som ska hända.

Andra faktorer som påverkar interaktiviteten i kommunikation är turtagningen och portabilitet av kommunikationsmedier. (Holsanova & Gärdenfors, 2008) Vid användning av handdator blir interaktiviteten rikare än vid användning av stationär dator eftersom tid och rum inte längre är lika betydelsefullt.

2.2.3 Tid

Vid kommunikation är tid en viktig faktor. En vanlig dialog är omedelbar, budskapet når mottagaren direkt vilket ger en direkt effekt av vad talaren säger. Då information sänds med en tidsförskjutning, blir budskapet väsentligt annorlunda. (Holsanova & Gärdenfors, 2008) För att säkra interaktionskvaliteten bör detta tas i beaktning, när information formuleras.

Det finns en annan skillnad mellan omedelbar och förskjuten kommunikation, vilken är att den förskjutna ger sändaren tid att planera och formulera budskapet eftersom omedelbar återkoppling inte krävs. (Holsanova & Gärdenfors, 2008) Detta är en styrka som flera digitala medier erbjuder.

2.2.4 Förmedling

Det som förmedlas i en kommunikation förväntas vara relevant; att det förmedlar något nytt och väsentligt i förhållande till mottagarens tidigare kunskap.

När två individer kommunicerar sätts en gemensam värld upp med gemensam

bakgrundskunskap; den fysiska omgivningen och den information som introduceras under samtalet. Detta kallas för Common Ground.(Holsanova & Gärdenfors, 2008)

Vid teknikstödd kommunikation kan inte en sådan värld byggas upp lika lätt och i vissa fall inte alls eftersom sändaren och mottagaren inte befinner sig på samma plats och inte

kommunicerar samtidigt och meddelandet förpackas i många fall i förväg vilket gör att den gemensamma världen blir mer begränsad. I de fall interaktionen sker verbalt, t.ex. i ett telefon- eller videosamtal kan Common Ground byggas upp, trots att det är svårare än vid face-to-face kommunikation. Vid kommunikation via brev är tidsförskjutningen stor och försvårar detta.

Ju fler mottagare – desto mindre blir den gemensamma världen. Därför ställs det högre krav på uttrycksformen som dåmåste vara tydligare för att undvika missförstånd.(Holsanova

(13)

& Gärdenfors, 2008) Vid utveckling av artefakter måste detta tas i beaktning eftersom det är osäkert i vilket sammanhang informationen kommer att uppackas och användas. Även vid brist på feedback kan kommunikationen påverkas negativt. Då är uttrycksformen särskilt viktig.

2.2.5 Ansikte – mot – ansikte vs Teknikstödd kommunikation

Generellt talat: ju likare en teknikstödd konversation är ansikte – mot – ansikte konversation – desto bättre interaktionskvalitet. Detta eftersom missförstånden minskar när information kan tas upp med flera sinnen och när responsen är omedelbar. Artikulering stödjer talet och kroppsspråket understryker vad sändaren menar med det som sänds genom talet.

2.3 Arbetsbelastning

Det finns två grundtyper av arbetsbelastning: fysisk och kognitiv, eller mental

arbetsbelastning. Båda typerna kan mätas med hjälp av objektiva eller subjektiva metoder. Det är vanligast att man mäter fysisk arbetsbelastning med objektiva metoder och mental belastning med subjektiva. Fysisk arbetsbelastning relaterar till den mängd energi en individ gör av med när en uppgift utförs. Den mäts på gymnastiska aktiviteter genom att mäta t.ex. syrekonsumtion eller hjärtfrekvens hos individen som utför aktiviteten. (Noyes, 2001) Denna uppsats kommer att ta upp mental arbetsbelastning som ett relevant mått av

interaktionskvalitet eftersom det mäter hur mycket energi som går åt när en uppgift utförs.

2.3.1 Kognitiv belastning

Kognitiv belastning, eller mental belastning är en omfattande term som sammanfattar hur mycket aktiv tankekraft en individ behöver ägna åt att lösa en uppgift. Ju mer tankekraft som krävs åt gränssnittet, desto mindre ges åt den faktiska uppgiften. (KTH: s lexikon, 2009-09-09) Alltså beskriver den kognitiva belastningen hur mycket sinnena behöver arbeta när en uppgift löses.

Om den kognitiva arbetsbelastningen är hög känner individen troligtvis stress och press när den interagerar. Om denna press är för hög måste interaktionen förbättras om individen ska fullfölja interaktionen. (Meersman & Tari, 2003) Därför är det relevant att mäta kognitiv belastning som ett mått på interaktionskvalitet.

Exempel på när arbetsbelastningen kan öka är om individen stöter på ett ovant koncept eller en ovan terminologi eftersom denne då måste hålla dessa i arbetsminnet som har en

(14)

begränsad storlek. Då uppfattar denne sannolikt belastningen som högre än när dessa är bekanta. Samma situation uppstår då individen stöter på sekvenser med uppgifter som inte stämmer överens med verkligheten. Vid frekvent påträffande av liknande koncept eller terminologi blir det en lägre belastning. (Meersman & Tari, 2003)

Att mäta kognitiv belastning innebär att man fastställer hur stor mental ansträngning som krävs vid interaktion. Arbetsbelastningen växer när avståndet från interaktionens mål och tidsbegränsningar ökar. (Hancock et al. 1989) Mental arbetsbelastning kan bli relaterad till fysiologiska tillstånd av stress och ansträngning, t.ex. hjärtfrekvens, och pupillstorlek. Det kan även relateras till subjektiva uppfattningar om stress, mental ansträngning och tidspress eller objektiva mätningar av prestationsnivåer som minskning i kvantitet och kvalitet av prestation. Den kognitiva belastningen påverkas av uppgiften samt av individens tidigare erfarenheter. (Schwaneveldt, 2009)

2.3.1.1 Mätning

Många koncept av kognitiv belastning fokuserar på vad aktören ska göra, i stället för att koncentrera sig på dynamik och interaktion. Enligt ett dynamiskt perspektiv mäts i stället aktörens varseblivning av och respons på uppgiften, eller hur denne faktiskt handlar. Det dynamiska konceptet bygger på tre dimensioner; den effektiva tiden för handling, det

uppfattade avståndet från det önskade målet samt nivån av ansträngning som krävs för att nå det önskade målet, under disponibel tid. (Hancock et al. 1989)

Det finns flera mätmetoder, en del av dem är subjektiva, andra objektiva. Vid objektiva, fysiologiska mätningar mäts ofta hjärtfrekvens och andetag. (Meersman & Tari, 2003) De fysiologiska metoderna innefattar mätningar av kognitiv belastning genom att titta på bl.a. elektrodermisk aktivitet, pupillutvidgning, blinkfrekvens, pupillstorlek, hjärtfrekvens, hjärtfrekvensvariation, blodets syresättning samt hudens ledningsförmåga. Subjektiva

mätmetoder baseras på frågor och tittar på flera faktorer, de har ofta varit pappersbaserade där en individ själv värderar sina känslor på en skala, numera finns mjukvara att tillgå.

(Meersman & Tari, 2003; Noyes, 2001) De grundas på individuella bedömningar. Två av de vanligaste subjektiva modellerna är NASA task load index och Subjective workload

assesment technique, vilka kommer att förklaras i metoddelen. (Noyes, 2001) Vid mätning av kognitiv belastning har de fysiologiska metoderna inte använts lika länge som de subjektiva.

(15)

2.3.1.2 Påverkan

Det finns flera faktorer som påverkar mätningar av mental belastning; individens övning av uppgiften, trötthet, talang eller färdighet. En uppgift som kan ses överväldigande kan efter lite övning vara väldigt enkel. (Schwaneveldt, 2009) Detta innebär att interaktionskvaliteten kan vara bättre för en uppgift då den utförs flera gånger gentemot då den endast utförs en gång. I detta fall blir det snittet eller förbättringar som räknas, i stället för enskilda handlingar.

2.3.1.3 Kognitiv belastning & Interaktion

Att mäta faktorer som mental belastning, frustration och förvirring är vanligtvis begränsade till kvalitativ observering av användare eller en administration av subjektiva frågeformulär. Dessa administreras vanligtvis efter utförande av en uppgift, vilket leder till att värdefulla insikter i individens skiftande upplevelse under utförande av uppgiften inte går att tillgå. (Hirshfield et al., 2007) Användning av fysiologiska mätmetoder har gett en ny aspekt av kognitiv belastning; en objektiv, kvantitativ uppskattning. Det är viktigt att nya tekniker och kombinationer mellan dem och de äldre undersöks.

Ett viktigt mål i design av gränssnitt är att reducera den mentala belastningen ägnad gränssnitts relaterade aspekter, så att mer mental kapacitet kan tillägnas den underliggande uppgiften. Målet är att designa användargränssnitt som använder information från hjärnan som en extra indatakanal, hellre än som primär indata. (Girouard et. al. 2009-09-03)

Med information om den mentala belastningen i realtid kan vi utvärdera interaktiva system och genast anpassa dess uppförande efter informationen som mäts från hjärnan. Detta skulle ge möjlighet att använda denna data, för att skapa gränssnitt som anpassar sig efter individens mentala belastning. (Girouard et. al. 2009-09-03) Vid överbelastning skulle

svårighetsnivån sänkas, medan en underbelastning skulle innebära en höjning i svårighetsgrad för att stimulera användaren. Överbelastning innebär stress, vilket i sin tur leder till fel vid försök att utföra en uppgift medan underbelastade individer minskar i produktivitet då de inte blir tillräckligt stimulerade och blir uttråkade och underutmanade.

Denna ökade information från hjärnan som vi kan ta del av vid mätning kan alltså användas till att förbättra effektiviteten eller intuiteten i interaktionen mellan en individ och ett gränssitt. (Hirshfield et al., 2007) Gränssnitt kan förbättras och därigenom förbättras användarens erfarenhet och utförande. (Treacy Solovey, 2009)

(16)

3. Mätmetoder

En avgränsning har gjorts mot fysiologiska respektive subjektiva mätmetoder. Metoddelen kommer att ta upp fem fysiologiska respektive tre subjektiva metoder för att mäta kognitiv belastning. Fysiologiska metoder innebär en mätning av hur kroppen reagerar vid interaktion - medan subjektiva innebär individens personliga bedömning, varigenom slutsatser kan dras avseende interaktionskvaliteten. Genom att mäta den kognitiva belastningen kan man få fram ett konkret resultat av hur stor ansträngning som krävs av individen vid interaktion.

Det finns två viktiga begrepp som sammanfattar styrkor hos mätmetoder, vilka ofta används när subjektiva metoder diskuteras: Känslighet och Upplösning. Känslighet syftar till vilka nivåer av arbetsbelastning som upptäcks, vid hög känslighet upptäcks även kortvariga sekvenser av förhöjd belastning (Luximon & Goonetilleke, 2001). Hur hög känslighet en metod har syftar till möjligheten att urskilja viktiga variationer i arbetsbelastningsnivåer vid utförande av en uppgift eller en grupp av uppgifter (Eggemeier, 1988). Upplösning syftar till teknikens kapacitet att skilja mellan mängden arbetsbelastning lagd på olika resurser eller förmågor hos den mänskliga aktören (Stassen et al. 1990) som t.ex. mellan mental och visuell arbetsbelastning. Om det finns vetskap om ifall belastningen ligger på det kognitivt visuella eller mentala området, finns det möjlighet att uppskatta sannolikheten att fel uppstår (Willem et al., 1996). Därför det viktigt att metoden stödjer upplösning och känslighet.

3.1 Fysiologiska metoder

Vid användning av vissa fysiologiska metoder kan signaler i hjärnan samlas in, vilka tyder på kognitiv aktivitet som mental belastning. Dessa ger kunskap om hjärnaktiviteten samtidigt som de är portabla och icke- invasiva för individen. (Treacy Solovey, 2009) Uppsatsen kommer att behandla två sådana metoder; Functional neuron infrared spectroscopy (fNIRS) och Electroencephalography (EEG) där den senare är en mer etablerad metod. Därtill kommer tre metoder att behandlas, vilka speglar hjärnans aktivitet på ett mer indirekt sätt, nämligen Heart rate variability (HRV) (inkluderar Interbeat interval (IBI)), Skin conductance response (SCR) samt mätningar av ögonaktivitet; förändringar i pupillstorlek, utvidgning och

(17)

3.1.1 Heart rate variability

Vid mätningar av IBI kalkyleras tiden mellan hjärtslagen och omvandlas som slag per minut. Generellt associeras en ökning av hjärtslag med en ökad kognitiv belastning. (Wilson & O’Donnell, 1988, Verwey & Veltman, 1996) Då den mentala ansträngningen ökar för att nå ett mål, ökar även aktörens upphetsningsnivå, vilken mäts med hjälp av denna metod. (Verwey & Veltman, 1996) Upphetsning är en bred term som syftar till den övergripande aktiveringen av IBI. Då upphetsningsnivån ökar, sker nämligen även en ökning i in- och utandning och pulsen går upp (se bild 1). Upphetsning är därför inte bara en indikator av emotionell aktivering; det är även en stark prediktor av två viktiga aspekter av kognition; uppmärksamhet och minne. Högt upphetsande händelser tenderar i att dra åt sig

uppmärksamhet och bli mer minnesvärda än lågt upphetsande situationer. Exempelvis tenderar de att vara låga vid sömn, och höga vid aktiva tillstånd som ökar mental arbetsbelastning, men kan även ökas av fysisk aktivitet. (Picard & Scheirer, 2001)

Flera forskare har dock fått olika resultat vid studier av IBI och kognitiv belastning. Detta har resulterat i mätning av HRV i stället för en mätning av endast frekvensen. Fler av

modellernahar använts, vilka gett motstridiga resultat. Detta har lett till förvirring bland forskare som använder metoden (Wilson & O’Donnell, 1988). Vid jämförelser av modellerna har forskare kommit fram till att flera av de äldre modellerna inte korrelerar med varandra, inte heller till svårighetsgrad vid kognitiva uppgifter. Under analyser har det framkommit att det finns tre komponenter som påverkar HRV, vilka har associerats med olika biologiska

Bild 1

Bilden visar ett exempel på ett mätinstrument för mätning av puls med sensorer som fästs på ett finger.

(18)

kontrollmekanismer; kroppens temperaturregleringsmekanism, blodtrycksreglering samt andningseffekten. Blodtrycksregleringen har visat sig variera med den mentala belastningen i uppgiften. Styrkan i regleringen minskar med ökad arbetsbelastning. Detta innebär att HRV minskar vid hög arbetsbelastning (Wilson & O’Donnell, 1988). Tillämpningar av metoderna behöver studeras vidare för att bestämma vilken som är bäst lämpad i en viss situation.

Styrkan i HRV- mätning ligger i dess noggrannhet vid uppskattning av särskilda effekter. IBI -mätning kan vara en bra metod vid uppskattning av upphetsning eller fysiskt arbete, det är dock oklart om mätningen ger information om andra variabler som mental arbetsbelastning. HRV kan vara bra som ett index vid mätning av specifika typer eller nivåer av mental

arbetsbelastning, men bör kombineras med flera metoder. (Wilson & O’Donnell, 1988) Man bör även ta i beaktande att det fysiska tillståndet kan påverka dessa mätningar t.ex. vid mätning som inkluderar fysisk aktivitet, då denna aktivitet kommer i konflikt med

uppskattning av kognitiv belastning. Mätningar av IBI och HRV är relativt lätta att genomföra och stödjer en diskret användning. De är även icke-invasiva. (Verwey & Veltman, 1996) HRV - Metoden är portabel och kan användas i flera situationer och hjärtfrekvensen kan spelas in från flera delar av kroppen.

3.1.2 Skin conductivity response

Skin conductivity response (SCR) är en metod för att mäta hudens konduktivitet; den

elektriska ledningsförmågan. Den elektrodermala responsen sker när huden tillfälligt ökar sin elektriska ledningsförmåga vid externt eller internt stimuli, vilket är fysiologiskt upphetsande. Hudens ledningsförmåga har alltså visat sig avspegla fysisk upphetsning, vilket tyder på kognitiv belastning. När en individ utsätts för hög kognitiv belastning ökar ledningsnivåerna hastigt för att sedan minskas gradvis.

Fenomenet kan spelas in från olika delar av kroppen. Den största delen av forskningen har genomförts på testdeltagare i en ovan laboratoriemiljö, ihopkopplade med en stationär

utrustning och ombedda att bete sig naturligt, (Picard & Scheirer, 2001) vilket sätter begränsningar i mätningarna samtidigt som det försätter testdeltagarna i en onormal och påträngande situation. Den nya tekniken mäter SCR med ett mätinstrument i form av en handske som fästs på handen där den känner av hudens konduktivitet och mäter nivån som visas på en skärm (se bild 2). (Picard & Scheirer, 2001) Användningen av handske i stället för äldre utrustning leder till att metoden blir mindre begränsad då testpersonen kan röra sig fritt, vilket resulterar i att studier av hudens konduktivitetsförändring vid stimuli kan genomföras i vardagliga situationer.

(19)

Exempel på händelser som kan höja responsen är en stark känsla, en häpnadsväckande händelse, t.ex. något skrämmande, smärta, träning, djup andning, en krävande uppgift etc. För att testet ska vara analyserbart i avseende av kognitiv belastning krävs att miljön inte innefattar några större förändringar i temperatur eller luftfuktighet samt att den fysiska belastningen för individen inte förändras under mätningen. (Picard & Scheirer, 2001) Detta innebär att mätning av kognitiv belastning i vardagliga situationer blir mindre tillförlitlig vid fysisk aktivitet, mätningarna bör därför anpassas därefter.

Metoden används ofta vid studier av kognitiv belastning och stress. SCR är känslig för flera olika typer av stimuli, varför det är svårt att avgöra orsaken till en specifik respons. Händelser som är nya eller intensiva utlöser en plöslig ökning i hudens konduktiva respons. Eftersom flera olika sorters händelser kan höja SCR, är det omöjligt för en observatör att avgöra vad som påverkat ökningen. Detta problem kan dock undvikas om flera kombinerade potentiella faktorer kontrolleras (Picard & Scheirer, 2001) genom en kombinering av flera mätmetoder. Den nya tekniken med en handske med sensorer tillåter även billigare och effektivare mätningar där testpersonen har möjlighet att röra sig fritt i vardaglig aktivitet och miljö.

3.1.3 Pupillutvidgning

Pupillutvidgning sker vid sänkningar i ljusintensitet i det visuella fältet, men det är även en reaktion av en individs kognitiva belastning vid utförande av en visuell uppgift, vilket innebär att pupillen utvidgas när den kognitiva belastningen ökar. Mätningar av pupillutvidgning

Bild 2

Bilden visar ett exempel på ett portabelt mätinstrument för mätning av hudens konduktivitet. Till vänster visas kretskortet, till höger handsken vari detta fästs. (Picard & Scheirer, 2001)

(20)

erbjuder hög relevant information om kognitiv blastning. Trots detta är det ovanligt att metoden används vid studier av användbarhet.

Mätinstrumentet är en så kallad eye tracker som kan vara stationär eller portabel, då den monteras i en hjälm (se bild 3). Systemet är videobaserat; en portabel eye tracker kan spela in förändringar i pupillstorleken via en dator som under testsessionen placeras i en ryggsäck. Med hjälp av denna teknik kan även blickbanor analyseras, genom att undersöka var i en bana en individ stöter på problem kan spatiala felplaceringar i en design upptäckas. Tekniken kan även användas vid mätning av blinkreflexen: en hög belastning innebär färre blinkningar. (Pomplun & Sunkara, 2003)

Det finns dock flera faktorer som kan påverka pupillutvidgning. Eftersom testpersonerna flyttar ögonen under försöken antar pupillerna olika vinklar och avstånd, från kameran på eye-trackern. Kameran mäter i pixlar, vilka blir fler i vissa vinklar och avstånd, som resulterar i att pupillerna mäts som olika stora. Effekten är störst då kameran är monterad nedanför ögonen. (Pomplun & Sunkara, 2003) Dagens teknik har lyckats undkomma denna geometribaserade förvridning nästan fullständigt med hjälp av en bättre kalibreringsteknik, vilken bygger på neurala nätverk som är adaptiva medan användning av en huvudmonterad eye-tracker undkommer problemet med avståndet. (Pomplun & Sunkara, 2003)

Portabiliteten gör att tekniken uppfattas som mindre störande och momentet blir lättare att utföra då testpersonerna snabbt glömmer utrustningen och lägger full koncentration vid uppgiften. Då det finns antydningar att blinkreflexen inte påverkas av mental belastning, att den endast visat en känslighet för visuellt belastande uppgifter bör denna faktor inte

analyseras vid mätning av mental belastning. (Verwey & Veltman, 1996) Att omgivande Bild 3

Bilden visar ett exempel på ögonmätning. Till vänster visas en huvudmonterad eye-tracker, till höger en kamerabild av en testdeltagares vänstra öga med pupill arean igenkänd av systemet. (http://www.cs.umb.edu/~marc/pubs/pomplun_hci2003.pdf)

(21)

belysning påverkar individens pupillstorlek liksom förändringar i belysning är en faktor som kan påverka pupillens storlek. Dessa förändringar kan därför komma i konflikt med den kognitiva belastningen (Pomplun & Sunkara, 2003) och måste därför kompenseras. Pomplun & Sunkara (2003) stödjer analyseringen av pupillutvidgning vid mätning av kognitiv

belastning som en snabb och pålitlig metod. Vid ögonmätningar missas ofta en analys av pupillstorleken (Pomplun & Sunkara, 2003) vilken kan användas som ett komplement till pupillutvidgningen.

3.1.4 Electroencephalography

Electroencephalography innebär att den elektriska aktiviteten över skalpen spelas in. Detta sker med hjälp av 115 elektroder som fästs på skalpen med gel, vilka klistras i ett rutmönster, enligt ett internationellt mått kallat 10-20 systemet (se bild 4). (Gevins et al, 1997)

Elektroderna mäter spänningen, relaterat till en referenspunkt. (Treacy Solovey, 2009)

Metoden har en tidsupplösning på 1ms, men signalen undertrycks av ljud från vätska, ben och skinn. Den störs även av elektronik i den omgivande miljön, varför sådan måste

undanröjas innan test genomförs. (Treacy Solovey, 2009) Nackdelarna med tekniken är att den har en stor förberedelsetid, det krävs att gel fästs på skalpen samt att den kan bli avbruten av elektroniska föremål i dess omgivning, dock gäller det inom rummet. Fördelen med metoden är att den har hög precision. Metoden har en begränsad spatial lösning, men god

Bild 4

Bilden visar ett exempel på mätning med Elecroencephalography med 115 elektroder utplacerade på skalpen. (wikipedia.org)

(22)

temporal. Metoden tillåter att titta på små nivåskillnader i kognitiv belastning. Eftersom tekniken tillåter att se var i hjärnan det sker en ökad aktivitet kan slutsatser dras om vilket sinne som belastas. (Treacy Solovey, 2009)

3.1.5 Fuctional near-infrared spectroscopy

Functional near-infrared spectroscopy är ett framträdande icke – invasivt, portabelt,

visualiserande verktyg som mäter nivåer av blodsyresättning i hjärnan. Metoden kan användas för att klassificera olika nivåer av mental belastning. (Hirshfield et al., 2009-09-06; Girouard et al, 2009-09-03)

Det är en relativt ny metod för att uppskatta hjärnaktivitet genom mätning av

hemoglobinkoncentration och blodsyresättning i vävnaden. Genom att mäta blodflödet i hjärnan spelas individens mentala tillstånd in (Girouard et al, 2009-09-03). Tekniken använder ljuskällor som placeras på skalpen där den sänder infrarött ljus in i huvudet. Eftersom biologisk vävnad är relativt transparent i detta våglängdsintervall kan tekniken användas för mätning ner till 2-3 cm in i vävnaden, vilket är tillräckligt för att nå hjärnbarken och mäta hjärnaktiviteten. Syresatt och syrefattigt hemoglobin är de huvudsakliga

absorberarna av infrarött ljus i vävnaderna. Det som mäts är förbränningen hos dessa vävnader, där en låg syresättning avspeglar en hög förbränning som i sin tur påvisar en hög mental belastning. På så vis kan forskare få information om hur syret bärs runt genom att använda sig av ljusdetektorer för att observerareflekterat ljus och undersöka hjärnbarken. (Hirshfield et al., 2009-09-06)

Mätinstrumentet består av två detektorer med ljuskällor, monterade på ett pannband som fästs på testpersonens huvud (se bild 5). (Hirshfield et al., 2009-09-06) Instrumentets fördel är portabiliteten och en design som lätt implementeras i testdeltagarens vardag. Detektorerna kan även monteras i andra huvudbonader.

Bild 5

Bilden visar; till vänster två detektorer med ljuskällor som fästs på pannloben i ett pannband; till höger ett exempel på mätning med functional near-infrared spectroscopy. (Hirshfield et al., 2009-09-06)

(23)

Hirshfield et al. (2009-09-06) har studerat Functional near-infrared spectroscopy för att undersöka om metoden kan mäta frontallobensaktivitet för uppskattning av arbetsbelastning. Syftet var också att klassificera nivåer av arbetsbelastning och att undersöka huruvida

metoden stödde en klassificering av dessa. Resultatet blev att metoden ger möjlighet att skilja olika nivåer av belastning från interaktionsstilar i en uppgift med en medelprecision på 83 % hos testdeltagare, vilket är en mycket hög siffra som visar på goda möjligheter. Metoden visade sig även ha lovande nivåer av klassificeringsprecision. Detta innebär att fNIRS är känslig för olika nivåer av arbetsbelastning och att mätningarna kan visa hur belastningen skiljer sig åt mellan olika interaktionsstilar. Därtill påvisades att utrustningen inte innebar några restriktioner hos individens interaktion samt att den möjliggör en insamling och överföring av data i realtid (Hirshfield et al., 2009-09-06). Även Giriuard et al, (2009-09-03) menar att tekniken är lovande då utrustningen inte innebär några orimligt motsträviga restriktioner och att den tillåter insamling och överföring av data i realtid (Giriuard et al, 2009-09-03). Detta visar på en stor möjlighet vid användning av fNIRS vid mätning av interaktionskvalitet.

För att utnyttja en metod är det nödvändigt att utveckla metoder att analysera output korrekt. Giriuard et al. (2009-09-03) har studerat möjligheten att genomföra undersökningar där olika nivåer av arbetsblastning mäts och föreslår en fortsatt forskning i utvärdering av nya interaktionsstilar (Girouard et al, 2009-09-03). fNIRS är en portabel metod som kan

implementeras sladdlöst utan att skada testdeltagaren (Hirshfield et al., 2009-09-06). Därmed tillåter tekniken mätning av interaktion i vardagliga situationer och miljöer (Girouard et al, 2009-09-03). Giriuard et al, (2009-09-03), ser möjligheterna i att använda metoden till utvärdering av nya interaktionsstilar som ett icke invasivt verktyg vid användning i adaptiva gränssnitt.

3.2 Subjektiva metoder

De mest använda subjektiva metoderna är NASA Task load index (NASA TLX) och

Subjective workload assessment technique (SWAT). (Meersman & Tari, 2003; Luximon och Goonetilleke, 1998) Subjektiv mental arbetsbelastning kan definieras som individens direkta bedömning eller jämförbara uppfattning av mental arbetsblastning uppfattad vid ett visst tillfälle. (Luximon & Goonetilleke, 2001) Både NASA TLX och SWAT är

multidimensionella skalor, skillnaden är att NASA TLX har sex dimensioner som mäts på en sammanhängande skala, medan SWAT mäts i tre dimensioner med en skala på tre nivåer.

(24)

Figur 2.

Bilden visar de tre dimensioner som SWAT metoden bygger på:

tidspress, mental ansträngning och psykologiska stress. (Reid, G. B., & Nygren, T. E., 1988)

(Luximon & Goonetilleke, 2001) Dessa metoder har jämförts i flera studier och nya metoder har konstruerats, flertalet väldigt lika SWAT och NASA TLX. MCH skalan liknar dessa, vilken kommer att presenteras nedan. Subjektiva mått har en hög tillförlitlighet. (Reid & Nygren, 1988)

3.2.1 Subjective workload assessment technique

SWAT baseras på att arbetsbelastning är ett multidimensionellt koncept som kan uppskattas genom att fråga deltagare om deras uppfattade tidspress, mentala ansträngning och

psykologiska stress (se figur 2). Att titta på arbetsbelastning i dessa tre dimensioner ger ökad känslighet och upplösning. (Verwey & Veltman, 1996)

Normalt utförs metoden med penna och papper, men det finns en mjukvaruversion att tillgå. (Stanton et al, 2005)SWAT använder sig av kortsortering i två procedurer, först genomför testdeltagare en förberedande kortsorteringsuppgift där deltagarna bedömer vilken kombination av kort som innebär högst mental belastning, följt av en procedur där uppgifter bedöms.

Deltagarna rankar de tre dimensionerna i alla möjliga kombinationer (27st), i förhållande till dess effekt av arbetsbelastning. Denna information används för att utveckla en

intervallskala från 1-100, för värdering av arbetsbelastning. Skalan bygger på nivå av enighet mellan testdeltagarna. Värdena översätts sedan till individuella arbetsbelastningsvärden för var dimension och en övergripande arbetsbelastningsvärdering kalkyleras. (Reid &

(25)

utvecklats, vilka används i nästa procedur där T = tid, S = stress och E = ansträngning (TES, TSE, ETS, EST, STE och SET).

Prioritetsordningarna används sedan baserat på hur viktiga de olika dimensionerna uppfattats. När antal prioritetsgrupper har bestämts genomför deltagaren uppgifter under analys för att ranka skalan från 1-100. Då rankas korten från det kort som representerar lägst arbetsbelastning till det som representerar högst. Metoden kan användas under eller efter genomförandet. Om det sker under utförandet bör det ske verbalt, då on-line administrering är påträngande för utförande av den primära uppgiften. (Reid & Nygren, 1988; Luximon & Goonetilleke 2001; Stanton et. al, 2005)

Enligt Stanton et. al, (2005) erbjuder SWAT - metoden en enkel procedur till en låg kostnad. Metoden är multidimensionell, inte påträngande när den administreras efter utförandet av uppgiften ochhar visat känslighet vid manipulationer i ansträngning vid undersökningar i flygmiljöer. (Stanton et. al, 2005) En känslighet för manipulationer ger möjlighet att jämföra olika designelement. Genom att manipulera den del i gränssnittet där en mental påverkan antas ske kan förbättringspotential för en ökad interaktionskvalitet

upptäckas.

Arbetsbelastningsdimensionerna är allmänna, så den kan även appliceras på fler domän. SWAT – metoden är en av de största med utbredd användning inom flera områden och den kan användas för att förutspå aktörers arbetsbelastning. Metoden kan dock bli påträngande vid on-line administrering.

I flertalet studier har det rapporterats att NASA TLX är överlägsen SWAT i känslighet, särskilt vid låga nivåer av mental arbetsbelastning; metoden har konstant kritiserats för att ha en låg känslighet till mental arbetsbelastning. (Stanton et. al, 2005) Även om SWAT är en vitt utbredd teknik, har den två huvudproblem: den har ingen känslighet för låg mental belastning och den kräver en kortsorteringsprocedur som är tidskrävande. Känsligheten i SWAT kan förbättras genom att tillägga fler undernivåer i var dimension. Detta skulle dock innebära att antal kombinationer och SWAT kort skulle öka drastiskt och kortsorteringsproceduren skulle bli svår, tidskrävande och leda till fel. (Luximon & Goonetilleke, 2001)

3.2.2 NASA task load index

NASA Task Load Index är en metod som används vid mätning av en testdeltagares mentala arbetsbelastning vid utförande av en uppgift. Metoden används för att bedöma

(26)

underskalor av arbetsbelastning; mental fordran, fysisk fordran, temporal fordran, ansträngning, utförande och frustrationsnivå.

NASA TLX - metoden kan genomföras med penna och papper, men idag används ofta ett mjukvaruprogram för presentation av skalor och analys av data. Metoden kan administreras antingen under eller efter utförandet av uppgiften, eftersom administrering under uppgiften är påträngande och påverkar utförandet av den primära uppgiften bör den subjektiva

bedömningen ske efteråt.

NASA TLX – metoden genomförs i följande steg: Testdeltagaren utför uppgiften under analys. Efter att uppgiften utförts under analys börjar viktningsproceduren, då 15-parvisa jämförelser av de sex underskalorna presenteras. I varje jämförelse väljer testdeltagaren den underskala som gav störst påverkan på den mentala arbetsbelastningen i uppgiften. Sedan kalkyleras hur många gånger underskalorna valdes och värderas i en skala från 0-5, där 0 är irrelevant och 5 är viktigare än någon annan faktor.

I nästa procedur värderar testdeltagarna underskalornas frågor, värderingen sker i

intervallskalor för varje underskala från 1 till 20, där 1 representerar låg belastning och 20 hög (se formulär nedan). Sedan används NASA TLX – metodens mjukvara för att räkna ut en generell arbetsbelastningsvärdering av uppgiften, vilket resulterar i en uppskattning mellan 0 och 100. Detta sker under analys. (Hart & Staveland, 1988; Stanton et. al, 2005) Då metoden används under utförandet bör metoden administreras verbalt för att undvika störning av den primära uppgiften (Stanton et. al, 2005).

NASA TLX är en snabb och enkel metod för att bedöma en aktörs arbetsbelastning. Dess underskalor är allmänna, så tekniken kan appliceras i vilka domäner som helst. Eftersom TLX mjukvarupaket tillhandahålls, kan det mesta analytiska arbetet undkommas, vilket resulterar i en väldigt snabb och enkel procedur. NASA TLX är en etablerad metod som har testats och används i ett antal utvärderingsstudier och är förmodligen den mest utbredda tekniken för att bedöma aktörens arbetsbelastning. När metoden administreras efter genomförandet av uppgiften är infallsvinkeln inte påträngande vid utförande av primäruppgifter.

NASA TLX har visat känslighet vid manipulationer av mental ansträngning i flera experiment, vilket gör det till en lovande teknik vid mätningar av interaktionskvalitet. Tekniken erbjuder precis som SWAT en multidimensionell infallsvinkel till värdering av arbetsbelastning, men enligt Stanton et.al (2005) har flertalet studier påvisat dess

överlägsenhet över SWAT metoden. Metoden kan dock bli påträngande och påverka

(27)

administrering efter genomförande finns det dock en risk att deltagare har glömt höga arbetsbelastningsaspekter av uppgiften.

Metoden innefattar en risk att arbetsbelastningsbedömningar kan bli relaterade till

uppgiftens utförande, då deltagare som presterade dåligt på den primära uppgiften kan komma att bedöma arbetsbelastningen som väldigt hög och liknande. Underskalans viktningsprocedur är arbetsam och lägger ytterligare tid till proceduren. Syftet med denna procedur är att ta reda på skillnader i definition av arbetsbelastning mellan bedömare samt skillnader mellan källor till kognitiv arbetsbelastning mellan uppgifterna, vilket gör den nödvändig för en pålitlig mätning. (Stanton et. al, 2005)

Formuläret nedan är taget och översatt från Hart & Staveland, (1988) och utgör ett exempel för hur NASA TLX – metodens bedömningsformulär ser ut:

Bedömningsformulär:

Namn Uppgift Datum

Mental fordran

Hur mycket mental belastning och perceptuell aktivitet krävdes (tänkande, beslutande, kalkylering, minne, tittande, letande etc)? Var uppgiften lätt eller krävande, enkel eller komplex, krävande eller angenäm? Låg _____________________________________________ Hög

Fysisk fordran

Hur mycket fysisk aktivitet krävdes (tryckande, dragande, vridande, aktivering etc)? Var uppgiften lätt eller krävande, saktfärdig eller uppiggande, saktfärdig eller rask, vilande eller experimentell?

Låg _____________________________________________ Hög Temporal fordran

Hur mycket tidspress kände du i förhållande till tempot, i vilket uppgiften eller uppgiftens moment dök upp? Var takten lugn och långsam eller snabb och stressig?

Låg _____________________________________________ Hög Ansträngning

Hur hårt behövde du arbeta, mentalt och fysiskt, för att nå din nivå av utförande? Låg _____________________________________________ Hög

Utförande

Hur bra tror du att du lyckades nå uppgiftens mål satt av analytikern (eller dig själv)? Hur nöjd blev du med ditt genomförande, i att nå dessa mål?

Låg _____________________________________________ Hög Frustrationsnivå

Hur osäker, missmodig, irriterad, stressad eller förargad kontra tillfredställd, nöjd, avslappnad och självgod kände du dig under uppgiften?

(28)

Figur 3.

Flödesdiagrammet visar de processer som The modified Cooper-Harper scale innefattar. (De tre första processerna genomförs även i SWAT och TLX – metoderna.)

(Stanton, 2005)

3.2.3 The Modified Cooper-Harper scale

MCH- skalan är en endimensionell metod. Metoden använder ett beslutsträdsflödesdiagram (se figur 3) för att värdera mental

belastning. Diagrammet är anpassat efter undersökningar relaterat till flygledning. MCH- skalan baseras på ställningstagandet att det finns en direkt relation mellan svårighetsgrad och arbetsbelastning.

Metoden administreras efter genomförandet av uppgiften.

Deltagaren följer beslutsträdet och svarar på frågor avseende uppgiften och systemet under analysering för att tillgodose en lämplig

bedömning av mental arbetsbelastning.Deltagaren genomför testet under analys. När deltagaren har genomfört uppgiften, fullföljder denne skalan, då denne arbetar sig genom beslutsträdet för att nå en mental arbetsbelastningsvärdering av uppgiften. Om det finns fler uppgifter genomför testdeltagaren de två sista stegen i beslutsträdet tills alla uppgifter värderats. Skalan varierar från 1-10 där 1 indikerar bäst handlingsutrymme och 10 sämst. (Stanton et. al, 2005)

NASA TLX och SWAT har visat sig högt relaterade till den modifierade MCH skalan. (Noyes, 2001) I MCH - skalan ställs följande frågor avseende en uppgifts svårighetsgrad:

• Är den mentala arbetsbelastningsnivån acceptabel? • Är felen små och inkonsekventa?

• Även om fel är stora eller frekventa, kan du utföra den instruerade uppgiften de flesta gångerna?

(Noyes, 2001)

MCH -skalan är väldigt enkel och snabb att använda, den kräver endast minimal träning. Den är intepåträngande och flera

utvärderingsstudier av metoden har genomförts. MCH - skalan har blivit utbrett använd för att mäta arbetsbelastning inom flera områden. En hög korrelation mellan subjektiv bedömningssvårighet och objektiv

arbetsbelastningsnivå har rapporterats och den har använts lyckat vid undersökningar som innefattat manipulationer i ansträngning. Metoden är

(29)

inte kostsam, den är diskret, lättadministrerad och lättöverförbar samt tillåter hög

tillförlitlighet. Data från endimensionella tekniker som MCH - skalan är lättare att analysera än den från multidimensionella. Det är dock en omodern metod som ursprungligen

utvecklades för att bedöma kontroll av flygplan och är därmed begränsad till manuella kontrolluppgifter. Data samlas in efter genomförandet av uppgiften, vilket leder till problem eftersom deltagare är dåliga på att rapportera förflutna mentala händelser. (Stanton et al, 2005)

4. Analys

Analysen kommer att genomföras utifrån nedanstående utvärderingsprocedur:

Wierwille & Eggemeier, (1993) föreslår att, för att en metod avsedd för värdering av mental arbetsbelastning ska rekommenderas till användning i ett test krävs en utvärderingsprocedur, vilken ska besitta följande egenskaper:

• Sensitivity – representerar till vilken grad tekniken kan skilja mellan olika nivåer av mental arbetsbelastning påtvingad en deltagare.

• Limited intrusiveness – representerar till vilken grad värderingen av tekniken stör utförandet av den primära uppgiften.

• Diagnosticity – representerar till vilken grad tekniken kan bestämma orsaken till arbetsbelastningen påtvingad en deltagare.

• Global sensitivity– representerar möjligheten att skilja mellan variationer i de olika typerna av resursåtgång eller faktorer som påverkar arbetsbelastning.

• Transferability – representerar till vilken grad tekniken kan appliceras i andra omgivningar än vad den var designad för.

• Ease of implementation – representerar till vilken nivå resurser krävs för att använda tekniken, som teknologi och övningskrav.

Wierwille och Eggemeier, (1993) föreslår att icke-påträngande arbetsbelastningstekniker som besitter en tillräcklig nivå av global sensitivity är de viktigaste, då det gäller test och

(30)

4.1 Jämförelse av subjektiva mätmetoder

M = MCH N = NASA TLX SW = SWAT

4.1.1 Sensitivity

M: Metoden har låg sensitivity.

N: Metoden har hög sensitivity, användning av intervallskalor är en bidragande orsak till

detta.

SW: Metoden har låg sensitivity.

Utvärdering: N uppfyller detta krav bäst

4.1.2 Limited intrusiveness

M: metoden är inte påträngande eftersom den administreras efter genomförandet av

uppgiften. Att data samlas in efter uppgiften utförts innebär problem, då deltagare är dåliga på att rapportera förflutna mentala händelser.

N: Inte påträngande när den administreras efter utförandet. Vid administrering under

utförandet kan metoden dock bli påträngande. Då krävs det att den sker verbalt. Att data samlas in efter uppgiften utförts innebär problem, då deltagare är dåliga på att rapportera förflutna mentala händelser. När data samlas in efter uppgiften utförts innebär problem, då deltagare är dåliga på att rapportera förflutna mentala händelser.

SW: Inte påträngande när den administreras efter utförandet. Vid administrering under

utförandet kan metoden dock bli påträngande. Då krävs det att den sker verbalt. När data samlas in efter uppgiften utförts innebär problem, då deltagare är dåliga på att rapportera förflutna mentala händelser.

Utvärdering: SW och N är likvärdiga. De tillåter en större flexibilitet än M, då de kan utföras

antingen före eller efter utförandet av uppgiften.

4.1.3 Diagnosticity

M: Metoden är endimensionell, vilket betyder att den inte tittar på flera orsaker. N: Metoden är multidimensionell, tittar på flera dimensioner genom användning av 6

(31)

SW: Metoden är multidimensionell metod: den tittar på tre dimensioner inom kognitiv

belastning.

Utvärdering: N och SW uppfyller detta krav bäst, då N har en tydligare indelning med sina 6

underskalor.

4.1.4 Global sensitivity

M: Metoden har använts lyckat vid manipulationer i ansträngning.

N: Metoden har visat sig känslig för manipuleringar i ansträngning. Metoden kan användas

för att förutspå aktörers arbetsbelastning.

SW: Metoden har visat sig känslig för manipuleringar i ansträngning. Kan användas för att

förutspå aktörers arbetsbelastning.

Utvärdering: N och SW tillåter variationer mellan olika typer av arbetsbelastning. Alla tre

metoderna ser lovande ut i avseende att skilja mellan olika faktorer som påverkar arbetsbelastning.

4.1.5 Transferability

M: Metoden är omodern och ursprungligen utvecklad för kontroll av flygplan och är

begränsad till manuella kontrolluppgifter. Inom dessa områden är den lättöverförbar.

N: Metoden kan appliceras i vardagliga situationer. Dess underskalor är allmänna: de kan

appliceras inom flera domäner.

SW: Metoden kan appliceras i vardagliga situationer. Arbetsbelastningsdimensionerna är

allmänna: De kan appliceras inom flera domäner.

Utvärdering: N och SW uppfyller detta krav.

4.1.6 Ease of implementation

M: metoden är enkel och snabb att tillämpa. Metoden kan genomföras med penna och papper.

Den är billig och kräver minimal träning. Data från endimensionella tekniker är lättare att analysera än den från multidimensionella.

N: Viktningsproceduren är arbetsam, men är nödvändig för en pålitlig mätning. Metoden är

snabb och enkel att tillämpa och analysera. Den kan utföras till en låg kostnad. Metoden tillåter användning av penna och papper eller mjukvara. Den kan användas innan eller efter utförandet av uppgiften. Metoden kräver träning.

SW: Metoden är enkel att tillämpa och analysera, men kräver en kortsorteringsprocedur som

(32)

papper eller mjukvara. Den kan användas innan eller efter utförandet av uppgiften. Metoden kräver träning.

Utvärdering: SW och N kräver mer träning än M. SW och N har procedurer som är

arbetsamma eller tidskrävande. I de fall metoderna genomförs med penna och papper är M överlägsen SW och N i tidsåtgång vid analys. I de fall SW och N använder mjukvara är analysen överlägsen M. SW - metodens kortsorteringsprocedur är mer arbetskrävande än viktningsproceduren i N - metoden.

4.1.7 Slutsats subjektiva metoder

MCH – skalan är underlägsen NASA TLX och SWAT – metoderna, trots att MCH-skalan kan vara mindre tidskrävande vid pappersbaserad tillämpning och trots att SWAT och NASA TLX innefattar arbetsamma procedurer. De senare är ändå tillförlitligare, då de antingen är överlägsna eller likvärdiga MCH – skalan i övriga punkter. NASA TLX -metoden är

överlägsen SWAT -metoden i sensitivity och dess diagnostisity är något bättre i än SWAT – metodens. Den är även mindre arbetsam än SWAT – metoden.

Data från MCH är lättare att analysera vid pappersbaserad tillämpning, men NASA TLX och SWAT tillhandahåller mjukvara för analysering, vilket tillåter en snabbare analys i de fall mjukvara används vid tillämpning.Dessa faktorer innebär att jag rekommenderar NASA TLX– metoden när subjektiv mätning av interaktionskvalitet tillämpas.

4.2 Jämförelse av fysiologiska mätmetoder

H = HRV & IBI S = SCR

Ö = Ögonaktivitet; pupillstorlek – och utvidgning samt blinkningar E = EEG

F = fNIRS

4.2.1 Sensitivity

H: Metoden känner av olika nivåskillnader i puls.

S: Metoden känner av den elektrodermiska responsen när huden tillfälligt ökar sin elektriska

ledningsförmåga. Nya eller intensiva händelser utlöser en plöslig ökning i hudens konduktiva respons.

(33)

E: Metoden har en tidsupplösning på 1 ms, vilket tillåter att titta på små nivåskillnader i

kognitiv belastning.

F: Metoden kan klassificera olika nivåer av mental belastning med hög tillförlitlighet. Utvärdering: H och S uppfyller detta krav. Det är oklart i vilken grad Ö uppfyller kravet. E

och F uppfyller kravet bäst, då de har en hög sensitivity.

4.2.2 Limited intrusiveness

H: Vid mätning av blodtrycksreglering kan portabla och icke-påträngande instrument

användas. Tekniken är icke-invasiv.

S: Vid användning av den nya tekniken med en handske med sensorer, är portabiliteten stor

och inte påträngande.Tekniken är icke-invasiv.

Ö: När en portabel eye-tracker används är tekniken inte påträngande. Tekniken är

icke-invasiv.

E: Tekniken är påträngande då 115 elektroder fästs med gel på huvudet, men den är

icke-invasiv.

F: Metoden är icke-invasiv och den är inte påträngande. Tekniken är portabel (pannband).

Utrustningen besitter inte några restriktioner i individens interaktion.

Utvärdering: H, S, Ö och F uppfyller detta krav. E är icke-invasiv, men påträngande och

mindre portabel.

4.2.3 Diagnosticity

H: Metoden kan vara bra vid uppskattning av upphetsning eller fysiskt arbete, det är dock

oklart om mätningen ger information om andra variabler som mental arbetsbelastning. Metoden kan inte skilja mellan olika typer av upphetsning.

S: Metoden är känslig för olika typer av stimuli, därför är det svårt att avgöra orsaken till en

specifik respons. Flera olika sorters händelser kan höja SCR, därför är det omöjligt att avgöra vad som påverkat ökningen. För att resultatet ska vara analyserbart krävs dock att miljön inte innefattar några större förändringar i temperatur och luftfuktighet och att den fysiska

belastningen inte förändras under mätningen.

Ö: Metoden mäter endast den visuella aspekten av arbetsbelastning.

E: Eftersom tekniken tillåter att se var i hjärnan det sker en ökad aktivitet kan slutsatser dras

om vilket sinne som belastas.

F: Metoden visar på en förbränning sker i hjärnan, varigenom slutsatser kan dras om vilket

(34)

Utvärdering: H och S uppfyller inte detta krav. Ö uppfyller inte detta krav, men kan urskilja

visuella aspekter. E kan urskilja orsak till arbetsbelastning. F uppfyller kravet delvis

4.2.4 Global sensitivity

H: Metoden kan vara bra som ett index vid mätning av specifika typer eller nivåer av mental

arbetsbelastning, men bör kombineras med flera metoder.

S: Om flera potentiella faktorer kontrolleras, genom en kombinering av flera metoder, kan

Diagnosticity problemet undvikas.

Ö: Med denna teknik kan spatiala felplaceringar i en design upptäckas.

E: Tekniken har en begränsad spatial lösning, men god tempotal. Metoden har en hög tillförlitlighet

F: Metoden ger möjlighet att skilja mellan olika nivåer av belastning från olika

interaktionsstilar i en uppgift med en hög tillförlitlighet.

Utvärdering: För att H och S ska nå rätt tillförlitlighet krävs att de kombineras med andra

metoder. Ö uppfyller endast en del av detta krav, då spatiala felplaceringar kan upptäckas. E tillåter att se när en belastning sker med hög precision och tillåter till viss del en urskiljning av resursåtgång. F uppfyller kravet delvis. Genom att skilja mellan olika nivåer av belastning från olika interaktionsstilar i en uppgift med en hög tillförlitlighet, kan indirekta slutsatser dras om vilka faktorer som påverkar arbetsbelastning samt vilka resurser som belastas.

4.2.5 Transferability

H: Metoden är portabel och kan användas i flera situationer, men det fysiska tillståndet kan

påverka mätningarna. Metoden kan spelas in från flera delar av kroppen.

S: Metoden är portabel och tillåter användaren att röra sig fritt i vardagliga miljöer.

Fenomenet kan spelas in från olika delar av kroppen.

Ö: Förändringar i belysning kan påverka pupillens storlek och störa mätningarna, detta måste

därför kompenseras.

E: Tekniken passar vid mätningar som kan ske i en laboratoriemiljö.

F: Metoden är sladdlös, portabel och tillåter mätning i vardagliga situationer och miljöer.

Utvärdering: H metoden tillåter inte mätningar i alla kontexter, den är delvis begränsad av

fysisk aktivitet. S uppfyller detta krav. Ö kan tillämpas inom alla domäner, med

begränsningen att belysning måste anpassas/kompenseras. E uppfyller detta krav delvis, med begränsningar då den har en liten portabilitet, undantaget denna begränsning tillåter den mätningar inom olika domäner. Den metod som uppfyller detta krav bäst är F som är sladdlös.

References

Related documents

Valnämnden beslutar att kandidater som förekommer på valsedlar som finns tillgängliga i vallokaler och röstningslokaler i Skurups kommun inte får arbeta som röstmottagare

Socialnämndens beredning föreslår socialnämnden besluta att godkänna yttrande gällande regional strategi, hälsa och kultur att yttrande gällande regional strategi, hälsa och

Orsaken till att lektioner har många elever är vanligen att grupper inte används för t.ex.. Skapa en egen grupp för varje lärare och gör en lektion

Kommunstyrelsens arbetsutskott beslutar att anvisa 20 000 kronor till tekniska kontoret för renovering av befintligt konstverk på torget i Sösdala, ur kommunstyrelsens konto

Marjo Svensson och Monica Johansson informerar hur budgeten ser ut för

Lärandenämndens sammanträde 15 november bör flyttas till 29 november för att det ska bli en så bra process som möjligt hösten 2018 inför beslut om detaljbudget

Det innebär att varje medborgare har rätt till utbildning för att kunna komma i arbete eller för att bli behörig till högskola eller yrkeshögskola.. Till denna rätt utgår

Föreligger skrivelse 2019-10-18 från socialförvaltningen av vilken framgår i socialtjänstlagen 16 kap 6 h § samt lag om stöd och service till vissa funktionshindrade 28 § h,