• No results found

Hur många poäng måste jag ha för att få VG?

N/A
N/A
Protected

Academic year: 2021

Share "Hur många poäng måste jag ha för att få VG?"

Copied!
63
0
0

Loading.... (view fulltext now)

Full text

(1)

Hur många poäng måste jag ha för att få VG?

En samstämmighetsanalys av betygskriterier och skriftliga prov i organisk kemi, kemi b.

Joakim Bodén Anders Hofverberg

Ht 2009

Examensarbete på lärarprogrammet, 15 hp Institutionen för Pedagogik, Umeå Universitet

(2)

Sammanfattning

I skolan använder sig lärare av skriftliga prov som ett av underlagen vid betygssättning, men det finns dåliga och bra prov. Ett bra prov utvärderar det som avses. Kan det vara så att betyg på skriftliga prov i dagens skola grundas på annat än vad som avses i betygskriterierna? För att granska detta gjordes en kvalitativ samstämmighetsanalys av autentiska prov och betygs- kriterier gällande organisk kemi, kemi b på gymnasiet. Till detta användes Blooms reviderade taxonomi. Undersökningen ämnade visa om skriftliga prov i var konstruerade på sådant vis att eleverna tilläts visa på kvalitéer som motsvarar Väl Godkänt (VG) och Mycket Väl God- känt (MVG). En kompletterande enkätundersökning genomfördes med avsikten att ta reda på ifall lärarna använder sig av skriftliga prov för att bedöma VG och MVG. De skriftliga pro- ven i vår undersökning och betygskriterierna för VG och MVG visar mycket dålig samstäm- mighet. De skriftliga proven betonar en lägre kognitiv nivå än betygskriterierna. Samtidigt visar enkätundersökningen att de skriftliga proven endast är en av flera underlag vid betygs- sättning.

Sökord:Samstämmighet, betyg, styrdokument

(3)

Innehållsförteckning

1. Inledning

... 5

1.1 Syfte... 5

1.2 Frågeställningar... 5

2. Bakgrund

... 6

2.1 Några viktiga begrepp... 6

2.1.1 Styrdokument... 6

2.1.2 Samstämmighet... 6

2.2 Samstämmighetsstudier... 6

2.3 Svenska betygssystemets utveckling... 7

2.3.1 Absoluta betygssystemet... 8

2.3.2 Relativa betygssystemet... 8

2.3.3 Idén bakom mål- och kunskapsstyrda betyg... 9

2.3.4 Mål- och kunskapsstyrda betygssystemet... 9

2.4 Bedömning och betygssättning... 10

2.4.1 Varför finns betygen... 10

2.4.2 Vad ska lärare bedöma?... 11

2.4.3 Vilka underlag har läraren till betygssättning?... 12

2.4.4 Betygskriteriernas funktion... 13

2.4.5 Likvärdigheten i det mål- och kunskapsrelaterade betygssystemet... 14

2.5 Olika typer av prov... 17

2.6 Samstämmighet... 17

2.7 Kategoriseringsmodeller... 18

2.7.1 En jämförelse... 19

2.7.2 Allmänt om Blooms reviderade taxonomi... 20

2.7.3 Blooms reviderade taxonomi – kunskapsdimensionen... 21

2.7.4 Blooms reviderade taxonomi – den kognitiva processdimensionen... 23

3. Metod

... 25

3.1 Avgränsningar och urval... 25

3.2 Bortfall... 26

3.3 Analys av prov- och betygskriterier... 26

3.4 Enkät... 29

3.5 Forskningsetiska överväganden... 30

4. Resultat

... 31

4.1 Samstämmighet mellan bedömarna (interbedömarreliabilitet)... 31

4.2 Enkäten... 31

5. Diskussion

... 41

5.1 Enkäten... 41

5.1.1 Första enkätfrågan... 41

5.1.2 Andra enkätfrågan... 42

5.1.3 Tredje enkätfrågan... 43

5.1.4 Sammanfattande diskussion om enkäten... 43

5.2 Prov... 44

5.3 Betygskriterierna... 45

5.4 Samstämmighet mellan prov och betygskriterier... 46

(4)

5.5 Metoden... 48

5.5.1 Reliabilitet... 49

5.5.2 Validitet... 51

5.5.3 Generaliserbarhet... 52

5.6 Vidare forskning... 52

6. Slutsatser

... 53

Källförteckning

... 54

Bilagor

Blooms reviderade taxonomi... Bilaga 1 Kursplan kemi b... Bilaga 2 Enkäten med följebrev... Bilaga 3

(5)

1. Inledning

I de diskussioner som förs i media syns ett växande intresse för betygen, betygen som ett verktyg för att skilja, mäta eller jämföra (Nordebo 2009; Stockholm TT 2009). Oavsett i vilket syfte betygen används förväntas det av allmänheten att betygen sätts efter samma normer och kriterier i hela den Svenska skolan. Det förväntas också att eleverna tillåts visa sin förtrogenhet i ämnet och att läraren skall kunna utvärdera elevens olika kognitiva pro- cesser samt vilka typer av kunskapsdimensioner eleven behärskar. Att konstruera frågor som går att utvärdera och som utvärderar det som avses är en av de svåraste uppgifter som en lärare möter. Konstruerar läraren skriftliga prov som tillåter eleven att visa på förståelse, förtrogenhet och färdighet? Om inte, när bedöms då hur väl eleven kombinerar och tilläm- par sina kunskaper? Frågorna är många och de går alla att relatera till detta examensarbetes huvudämne, hur betyg och bedömningar är relaterade till varandra. Genom att observera och delta vid bedömningstillfällen på den verksamhetsförlagda utbildningen (VFU) har vi kommit i kontakt med denna för läraryrket grundläggande process, och allt eftersom har en viss skepsis byggts upp. Bedöms det som avses bedömas? Och på de grunder som är avsed- da? Det var frågor som dessa som avgjorde valet av ämne.

Framförallt är det frågan om det finns en generell trend av att lägre kognitiva kvalitéer i en större kvantitet genererar höga betyg som fångat vårt intresse, då vi från både vår egen skolgång och senare erfarenheter tyckt oss skönja ett sådant mönster.

1.1 Syfte

Syftet med detta arbete är att försöka belysa frågan om betygskriterierna och proven är samstämmiga. Det är framförallt de högre betygen väl godkänt (VG) och mycket väl god- känt (MVG) som intresserar oss då det har visats att dessa nivåer är svåra att visa på skrift- liga prov, eftersom de innebär krav på en högre kognitiv nivå (Andersson 1999).

1.2 Frågeställningar

• Är de skriftliga proven som analyserats i undersökningen konstruerade på ett sätt som tillåter eleven att visa på VG- och MVG-kvalitéer?

• Är de skriftliga proven det verktyg som lärarna i denna undersökning använder sig av för att bedöma VG- och MVG-kvalitéer?

(6)

2. Bakgrund

2.1 Några viktiga begrepp 2.1.1 Styrdokument

Det som termen styrdokument syftar på i denna rapport är alla de dokument som styr den svenska skolans utformning och, av störst relevans i detta fall, betygssättningen. Till dessa dokument räknas främst kursplaner och läroplaner, men även till viss del skollagen.

2.1.2 Samstämmighet

Ordet samstämd definieras av Svenska Akademins Ordlista (SAOL på nätet 2007) som

”som passar väl ihop”. Alignment, den engelska översättningen av samstämmighet, definie- ras som ”arrangement in a straight line” (Oxford advanced learner’s dictionary). Detta är ordets allmänna mening, men termen definieras vidare i dess användning som fackterm i den pedagogiskt inriktade forskningen. Överlag rör det sig om hur väl två olika objekt stämmer överrens, men vilka dessa objekt kan vara varierar med författarna. Webb (1997) menar att “Alignment is the degree to which expectations and assessments are in agreement and serve in conjunction with one another to guide the system toward students learning what they are expected to know and do” (s. 3). Bhola, Impara och Buckendahl (2003) specificerar “expectations” som “a state’s content standards for a specific subject area” (s.

1).

Det finns dock de som vill bredda begreppet till att omfatta även andra objekt. Porter et al.

(2007) menar att samstämmighet har två dimensioner: horisontell samstämmighet, t.ex.

inom en nivå av beslutsfattare, och vertikal samstämmighet, till exempel mellan beslutsfat- tare och skolor. I Porters modell för samstämmighetsanalys omfattas även lärarens under- visning av samstämmighetsbegreppet (Porter 2002; Porter et al. 2007). Vissa som uteläm- nar denna dimension väljer istället att anta att samstämmighet mellan styrdokument och lärarens undervisning är en förutsättning för samstämmighet i övrigt (La Marca et al. 2000).

2.2 Samstämmighetsstudier

Ingen tidigare forskning på samstämmigheten mellan betygskriterier och prov har hittats under litteratursökningen till denna uppsats. Dock finns det andra typer av samstämmig- hetsanalyser som gjorts inom skolans värld. De flesta av dessa undersökningar är utförda i

(7)

USA och avser samstämmigheten mellan prov och mål ur styrdokumenten (se till exempel Liu & Fulmer 2008; Webb 1999). Detta beror enligt bland annat Bhola, Impara och Buck- endahl (2003) och Porter et al. (2007) på en lag som kom i USA 2001, the No Child Left Behind (NCLB) Act. I denna lag slås det bland annat fast att USA:s stater måste ha utveck- lat styrdokument (content standards) och bedömningsformer (assessments) som är sam- stämmiga. Det finns även undersökningar där stater i USA jämförs med andra länder (Liu et al. 2008).

Förutom studier där utvärdering av samstämmigheten i ett visst system är i fokus och de metodbeskrivningar som beskrivs närmare i litteraturgenomgången (se 2.7 Kategorise- ringsmodeller) och metoddelen (se 3.3 Analys av prov- och betygskriterier) i detta arbete, finns det även studier som koncentrerar sig på utvärdering av metoder för samstämmighets- analyser. Även här är många studier utförda i USA (se till exempel Bhola, Impara & Buck- endahl 2003; Rothman 2003) men även svenska studier påträffas (Näsström 2008; Stenlund 2006).

2.3 Svenska betygssystemets utveckling

Att redogöra för betygssystemets historia kan göras med olika ansatser. Samhällets tenden- ser har avgörande betydelse för strukturen i skolan där historiska händelser inverkar med olika dignitet på skolverksamheten. Avsikten med denna del är dock inte att djupare beskri- va de historiska och politiska skeenden som påverkar styrningen av skola. Fokus i denna återblick är på resultatet av de politiska besluten där tyngdpunkten landar i dagens betygs- system och dess roll i skolan.

Betygens tillämpning i skolan är ett återkommande bryderi som har diskuteras, debatteras och formats av många (se till exempel: Andersson 1991,1999; Jansdotter Samuelsson &

Nordgren 2008; Måhl 1991; Selghed 2006; Tohlin 2006). Historiskt har svenska skolan gått från det absoluta betygssystemet, där betygen saknade anvisningar och lärarens egen prin- cip blev styrande för betygssättningen, via det relativa betygssystemet till dagens mål- och kunskapsstyrda betygssystem (Skolverket 2008). I följande avsnitt beskrivs dessa tre be- tygssystem och en kort redogörelse för några tankar kring växlingen mellan dessa presente- ras.

(8)

2.3.1 Absoluta betygssystemet

Bokstavssystemet som fanns i skolan fram till andra världskrigets slut speglar en statisk samhällsbild där förändringstakten är låg (Selghed 2006). Samhället går från ett jordbruks- samhälle mot ett mer industrialiserat samhälle där monarkin alltmer avtrubbas och demo- kratiska värderingar växer fram (Jansdotter Samuelsson & Nordgren 2008). Både Jansdot- ter Samuelsson och Nordgren (2008) och Selghed (2006) beskriver skeenden i samhället som strävar mot en liberalare politisk syn där kunskapsspridningen blir allt viktigare. Ett samhälle där människorna börjar flytta till jobben och kvalitéer som att skriva, läsa och räkna blir allt viktigare. Det parallella skolsystemet växer fram med en skola för alla och en skola för de blivande tjänstemännen, en skola som enligt Jansdotter Samuelsson och Nord- gren (2008) inte hade några tydliga riktlinjer, en skola utan en förankrad betygsskala eller uniform organisation. De tidigaste betygen mätte absolut kunskap med hjälp av läroverkets studentexamina där man såg mänskligt tänkande som grund för kunskap (SOU 1992:86).

Den rationalistiska kunskapsuppfattningen framställs av Selghed (2006) som förklaringen till tidens skolsyn där kunskap beskrevs som eviga sanningar och att lära sig saker utantill var av vikt och lärarna bedömde elevers flit, uppförande och begåvning. Allt eftersom kra- vet på högre utbildning höjdes och behovet av specialister ökade framställdes krav på att betygen även skulle fungera som urvalsgrund (Isling 1998). Kraftiga svängningar i samhäl- let och en internationalisering ledde till att staten beslutade om att reformera skolsystemet (Selghed 2006).

2.3.2 Relativa betygssystemet

I 1957 års skolberedning föreslås en relativ skala där medelstudenten i årskursen blir stan- dard för bedömning (SOU 1961:30). Den sjugradiga bokstavsskalan ersätts med en femgra- dig sifferskala i vilken objektiv och kvantitativ kunskap var i fokus (Selghed 2006). God- kändgränsen tas bort. I en skola som skall inkludera alla människor bör inte en sådan skilje- linje ritas ut, skriver Andersson (1991) i sin bok De relativa betygens uppgång och fall.

Med detta menar Andersson att beslutet är förenligt med det relativa tänkandet, samtidigt som han konstaterar att betyg i ordning och uppförande blir lik tidigare modell. Lgr 62 for- mas och den femgradiga relativa skalan blir verklighet där centralt utgivna skriftliga prov blir ett hjälpmedel för lärarna vid betygssättning (ibid.).

I Jansdotter Samuelsson och Nordgren (2008) behandlas kvalitetsbegreppet i betygsättning- en där standardproven från skolöverstyrelsen skall fungera som måttstock och hjälpmedel

(9)

till lärarnas bedömning och betygssättning. Vidare klarlägger Jansdotter Samuelsson och Nordgren kopplingen till normalfördelningskurvan där nationen skulle utgöra normen och att betygsfördelningen skall vara relativ. Denna strömning skedde inte bara i Sverige utan i stora delar av västvärlden (Korp 2006) och Jansdotter Samuelsson och Nordgren (2008) skildrar hur detta hade ett samband med att andra samhällsområden också gavs ökad statlig styrning i denna centraliseringsepok.

Perioden fram till 1980 brukar även benämnas som en deprofessionaliseringsepok av sko- lan där centrala och externa verktyg formades av staten och lärarens tillvaro blev alltmer styrd (ibid.). Ändrade läroplaner gav samtidigt lärarna tydligare riktlinjer för samarbete mellan ämneskollegor, dels för att öka betygens likvärdighet, dels för att åstadkomma en strävan mot gemensamma mål (ibid.). Detta konstaterar Jansdotter Samuelsson och Nord- gren (2008) gå stick i stäv med dåvarande betygssystem som urvalsmetod och kan ses som starten på reformeringen mot dagens betygssystem. I tider då man talar om vikten av rätt man på rätt plats (Selghed 2006) blev kritiken mot det relativa betygssystemet hård då det i själva verket endast beskrev hur en elevs kunskaper förhöll sig till en annans (Andersson 1991). I Anderssons bok De relativa betygens uppgång och fall (1991) belyser författaren kritiken mot det relativa betygssystemet och proklamerar kravet på målrelaterade betyg.

2.3.3 Idén bakom mål- och kunskapsstyrda betyg

Selghed (2006) beskriver kriterierelaterad bedömning som ett försök att stipulera om en elev innehar en bestämd egenskap eller förmåga genom att dessa egenskaper eller förmågor jämförs mot fastlagda ramar. Med detta menar Selghed att resultatet som eleven presterar inte avses att jämföras med andra elevers resultat utan endast används för att utröna ifall eleven har nått ett mål. Dessa principer menar Selghed ligger till grund för Sveriges mål- och kunskapsstyrda betygssystem. De delar av samhället där målbeskrivningar anses bringa framgång diskuterar Andersson (1999) och visar på en distinkt koppling till industrin och tydligheten med dess målbeskrivning. Den påverkan som sker på skolan genom samhälls- strömningar i dessa tider och idag är påtaglig.

2.3.4 Mål- och kunskapsstyrda betygssystemet

Debatten under 80-talet understryker behovet av resultat och målstyrning inom skolan och i slutet av 1989 tillsätts en expertgrupp som har till uppgift att arbeta fram en övergång från det relativa till det målrelaterade betygssystemet (Andersson 1991, 1999). I SOU 1992:86

(10)

beskriver dåvarande skolminister Göran Persson att utgångspunkten för det nya betygssy- stemet skall vara att elevernas faktiska prestationer bedöms mot uppställda mål. Urvalsme- toden tonas ner och kvalitativa och generella kunskapsmål hamnar i fokus (Jansdotter Sa- muelsson och Nordgren 2008). Andersson (1999) tar upp ännu ett yttrande i sin bok Varför betyg där skolministern berör kravet på jämförbarhet och påtalar att principen för detta är att ta fram tydliga mål- och kravbeskrivningar. Arbetet fram till införandet av Läroplanen för de frivilliga skolformerna (Lpf 94) genomsyras dock av en misstro från beredningen på jämförbarheten i det nya systemet. I det slutgiltiga förslaget (prop. 1994/95:85) som leder till Lpf 94 fanns en fyrgradig betygsskala: Icke Godkänt, Godkänt, Väl Godkänt och Myck- et Väl Godkänt med ett tillägg på betygskriterier till betygen G och VG (Andersson 1999).

Standardiserade relativa prov föregick dagens provskola där influenser under slutet av 90- talet styrde provkonstruktionen mot processer i lärandet (ibid.). Med detta menar Anders- son att fokus har flyttats från den psykometriska traditionen mot en högre kognitiv nivå där klart mätbara metoder ersätts alltmer av mer öppna uppgifter som visar på förståelse och reflektion. Andersson vidhåller också att en vanlig uppfattning är att skriftliga prov ofta mäter minneskunskaper och faktakunskaper medan den fördjupade kognitiva nivån sällan eller aldrig nås.

2.4 Bedömning och betygssättning

Följande definition av bedömning, som görs av Selghed (2006), är den innebörd som avses i detta arbete: ”Bedömning är den process som består av lärarens arbete med att bilda sig en uppfattning om elevens totala utveckling, det vill säga både kunskapsmässigt, språkligt, känslomässigt och socialt” (s. 11). Vidare definierar Selghed betygsättning som ”(…) att läraren, vid en given tidpunkt, skall sammanfatta sina bedömningar av elevens kunskaper och kunnande i de ämnen som ingår i kursplanen eller kursen och uttrycka detta i ett av betygen icke godkänd, godkänd, väl godkänd eller mycket väl godkänd, beroende på kvali- teten i kunskaperna och kunnandet hos eleven.” (s. 11).

2.4.1 Varför finns betygen

Jansdotter Samuelsson och Nordgren (2008) beskriver några allmänna tillämpningar hos betygen. Urvalsfunktionen hävdas vara betygens grundfunktion där rangordningen ger för- tur till dem som klarar kriterierna för betygen bäst. Betygen kan samtidigt användas som en informationsbärare där en anvisning om elevens kunskapsutveckling i förhållande till be- tygskriterierna beskrivs. Denna information tolkas av mottagaren och kan sedan användas

(11)

på olika sätt. Ett av användningsområdena är att möjligheten att kontrollera likvärdigheten mellan skolor där nationella och internationella jämförelser verkar för en utökad jämlikhet.

Betygen kan uppfattas som motiverande i vissa fall medan andra uppfattar betyget som för- lamande. Den maktrelationen som betyget innebär uttrycker ramarna för eleverna och an- ger vad som värderas vid betygssättning. Dessa tillämpningar kan tematiseras med olika ansatser och Jansdotter Samuelsson och Nordgren visar på att det finns en relation mellan betygens funktion och lärarens professionella utrymme. Jansdotter Samuelsson och Nord- gren (2008) hävdar att en för stark statlig kontroll inskränker på lärarens professionalism och kan leda till att läraryrket deprofessionaliseras.

I propositionen till det betygssystem som sittande regering har arbetat fram (Prop.2008/09:66), så beskriver regeringen skälen till införandet av fler betygssteg. Genom fler betygssteg vill regeringen bland annat att lärarna ska ha möjlighet att göra mer precisa bedömningar av elevernas kunskapsnivåer och hur eleven utvecklas inom dessa ska bli tyd- ligare. De hoppas också att eleverna ska känna att betygen blir rättvisare då tydligheten i bedömningen ökar. Tanken är även att fler elever kommer vara nära ett högre betyg och därför känna sig sporrade att satsa lite extra för att uppnå detta högre betygssteg.

2.4.2 Vad ska lärare bedöma?

Selghed (2006) anser att lärare i Sverige har en unik position och påpekar hur viktigt det är för lärare som auktoritära bedömare och betygssättare att ha god förståelse för vad som skall bedömas och hur denna process är utformad. Andersson (1999) och Selghed (2006) analyserar styrdokumenten och konstaterar att dessa tydligt visar att läraren skall bedöma och betygssätta elevens formella kompetens. Andersson (1999) konstaterar att styrdoku- menten inte ger stöd för betygssättning av personlighetsegenskaper och får medhåll av Selghed (2006) som väljer att använda sig av begreppet personlighets- och beteendeaspek- ter och vidhåller att lärare inte ska ta hänsyn till denna sociala utveckling. Jansdotter Samu- elsson och Nordgren (2008) slår fast att sådana saker som uppförande, närvaro, flit, ambi- tion och läxläsning inte ska ligga till grund för betyget. Det enda som egentligen bedöms är om eleven når en högre kunskapsnivå, något som i och för sig kan vara följden av flit och ambition. Däremot anser Jansdotter Samuelsson och Nordgren att det finns stöd för att ar- betsprocessen bör inkluderas i den formativa bedömningen. Selgheds gör i boken Betyg i skolan från 2006 en analys av vad lärarna tar fasta på i elevers prestationer vid betygsätt- ning, och detta resulterar i sex olika kategorier:

(12)

A. Elevens kunskaper och färdigheter B. Elevens sätt att agera i skolarbetet C. Eleven som person

D. Skolorganisatoriska aspekter E. Externa krav och förväntningar F. Lärarens personliga läggning (s. 174)

Selghed skriver senare i samma bok att detta tydligt visar på att aspekter som inte skall vä- gas in i betyget ändå vägs in och att några av dessa aspekter inte kan påverkas av eleven själv. Vidare ifrågasätter Selghed målen och kriteriernas formuleringar där han tycker sig se att dessa är vilseledande och försvårar betygssättningen (för ett exempel på betygskriterier, se bilaga. 2). Ändå är kravet på stöd till bedömning är något som har redovisats i flera un- dersökningar (Skolverket 2000, 2001).

Styrdokumenten som är fastställda genom gängse normer av regeringen har olika ansatser. I gymnasieförordningen (SFS 1992:394) beskrivs bestämmelser för betygen. Här preciseras exempelvis användandet av nationella prov som likvärdighetsverktyg. I läroplanen för de fria skolformerna (Lpf 94), står det att:

Betygen uttrycker i vad mån den enskilda eleven har uppnått de kunskapsmål som uttrycks i kurs- planen för respektive kurs och som definieras i betygskriterier. (…) Läraren ska vid betygsättningen

• utnyttja all tillgänglig information om elevens kunskaper i förhållande till kraven i kursplanen,

• beakta även sådana kunskaper som en elev tillägnat sig på annat sätt än genom den aktuella un- dervisningen,

• beakta såväl muntliga som skriftliga bevis på kunskaper, och

• göra en allsidig bedömning av kunskaperna och därvid beakta hela kursen. (s 16)

2.4.3 Vilka underlag har läraren till betygssättning?

En tydlig tendens, enligt Korp (2006), är att lärare till största del använder sig av skriftliga prov vid betygssättning och muntliga prov eller mer informella bedömningar får litet ut- rymme. Dock använder sig lärare av flera olika typer av underlag vid betygssättning:

Uppgifter som lärare i svenska och engelska tog upp som underlag för betygssättning var, utöver de nationella proven:

• Skriftliga och muntliga redovisningar och recensioner av litterära texter

(13)

• Större och mindre prov som liknar de nationella proven eller någon del av dem

• Tal av olika slag och talövningar i grupp och par

• Autentiska skrivuppgifter (…)

• Läxprov (…) (Korp 2006 s. 206)

Senare konstaterar Korp att det finns skillnader mellan olika program och skolor sett till omfattningen av underlaget. Hon menar att vissa program generellt har uppgifter som är av en återgivande natur medan andra program understryker vikten av analys och teori. Alla subjektiva bedömningar som görs anser Egidius (2005) vara av låg reliabilitet medan stan- dardiserade flervalsfrågor är av hög reliabilitet. Dessa standardiserade frågor som enkelt kan klassificeras menar också Andersson (1999) visar på en hög reliabilitet samtidigt som denna klassificering innebär en förenkling av provfrågorna.

2.4.4 Betygskriteriernas funktion

Betygskriterierna togs fram i och med införandet av det nya betygssystemet 1994 och krite- rier för godkänt och väl godkänt för gymnasiekurser presenterades i SOLFS 1994:11 (Skol- verket 1994). Kriterier för mycket väl godkänt kom först 2000 (Jansdotter Samuelsson &

Nordgren 2008). Underlag för betygskriterierna togs fram av Skolverket i samarbete med 150 gymnasie- och komvuxlärare anställda inom Örebro kommun (Skolverket 1994).

I Lpf 94 står det att betyget skall uttrycka: ”(…) i vad mån den enskilda eleven har uppnått de kunskapsmål som uttrycks i kursplanen för respektive kurs” (s. 15). Tanken med betygs- kriterierna är att de ska definiera detta närmare (Skolverket 1994). De ska alltså förtydliga kraven i kursplanen och därigenom fungera som ett stöd för läraren vid betygssättning (ibid.). Kunskapssynen baseras, liksom läroplanen Lpf 94, på SOU 1992:94, Skola för bild- ning, där de fyra olika kunskapsformerna fakta, förståelse, färdigheter och förtrogenhet beskrivs. Dessa kunskapsformer, de ”fyra f:en”, är sammanvävda i betygskriterierna (Jans- dotter Samuelsson & Nordgren 2008)

I Skolverkets (1994) skrift Betygsboken återfinns en beskrivning över olika uttryck för ni- våskillnader i betygskriterierna. Dessa nivåuttryck sammanfattas av Andersson (1994) som situationens komplexitet, graden av självständighet och resultatens kvalité. Vidare anges aktiva verb, som beskriver och förklarar, för att beskriva kvalitativa skillnader i elevernas kunskapsnivå och betyget väl godkänt ska visa på ”en verklig fördjupning av kunskaperna i

(14)

ämnet” jämfört med betyget godkänt (Skolverket 1994, s. 10). Dock behöver inte stegen mellan olika betyg vara lika stora, det vill säga progressionen behöver inte vara linjär.

Dessutom kan graden av kunskapsfördjupning som skiljer stegen åt variera mellan olika kurser (ibid.)

Dock finns det kritiker som hävdar att kriterierna inte fungerar som de ska. Andersson (1999) anser att det inte finns några tydliga kvalitativa kunskapsnivåer och att det ofta sak- nas progression mellan godkänt och väl godkänt. Andersson menar vidare att betygskriteri- erna saknar bas i kunskapsteori, istället tycks det som om kursplanernas mål fått utgöra grunden för dem. Han får delvis medhåll av Jansdotter Samuelsson och Nordgren (2008) som skriver att den största skillnaden mellan de olika nivåerna ligger i vilken grad av själv- ständighet och initiativ som krävs av eleverna. Dock menar Jansdotter Samuelsson och Nordgren att en viss progression kan anas, även om den är komplex och flerdimensionell.

Avslutningsvis kan det konstateras att Andersson (1999) är starkt kritisk till betygskriteri- ernas utformning. Han menar på att de på riksnivå är både inkonsekventa och luddiga till den grad att lärarna får stora problem med sina tolkningar av dem. Ett annat problem som flera författare tar upp är att skillnaderna mellan mål och kriterier i skolans styrdokument är förvirrande och detta gör att fokus flyttas mot de mer stringenta betygskriterierna (Anders- son 1999; Selghed 2006). Denna förvirring gör att läraren känner att stödet vid bedöm- ningssituationerna är otillräckligt (Selghed 2006).

2.4.5 Likvärdigheten i det mål- och kunskapsrelaterade betygssystemet

Ett problem som ofta lyfts fram i debatter kring betygssystem är rättviseaspekten där lik- värdigheten i bedömningen anses vara ett stort problem (Nordebo 2009; Skolverket 2009;

Stockholm TT 2009). Tidigare i denna rapport gjordes en historisk återblick gällande be- tygssättning och bedömning där det beskrevs hur betyget har gått från ett skiljeverktyg till ett mätverktyg. Politiska skeenden till trots sker en progression i skolan mot en mer struktu- rerad bedömning av människors kunskaper där validering av bedömningen är central (Egi- dius 2005). I Skolverkets Handlingsplan för en rättsäker och likvärdig betygssättning (2004b) konstateras att ”en rättvis betygssättning innebär att det betyg en elev fått i ett visst ämne eller i en viss kurs ska visa elevens kunskaper och färdigheter i det som skall ingå i kursen enligt kursplanen och som motsvarar betygskriterierna för betyget” (Skolverket 2004b, s. 3). Senare definieras likvärdig bedömning som ett fall där ett betyg i en klass ska

(15)

vara jämförbart med samma betyg för en annan klass. Bedömningen skall alltså vara lik- värdig för alla elever. Men är betygen verkligen rättvisa? Skolverkets analys av sambandet mellan nationella prov och kursbetyg visar flera resultat som aktualiserar denna debatt (Skolverket 2009). Skolverket (2000) skriver i sin nationella kvalitetsgranskning angående betygssättningen att det finns stora brister gällande en likvärdig och rättvis betygssättning, och dessutom har ansvaret i alltför stor utsträckning lagts på lärarna. Med detta menar Skol- verket att kommuner och stat inte erbjudit lärarna och skolorna det stöd som behövdes vid införandet av det nya betygssystemet. I senare utredningar diskuteras hur främjandet av likvärdig betygssättning sett ut och vad som görs och gjorts (Skolverket 2007). Där nämns de nationella kursplanerna, inklusive både uppnåendemål och betygskriterier, som det vik- tigaste statliga verktyget för en likvärdig bedömning. Även fortbildning för aktiva lärare och krav på förtrogenhet gällande betygssättning för blivande lärare är metoder som staten använder sig av för att främja likvärdigheten. Dessutom ger Skolverket ut olika stöd för betygssättning, så som allmänna råd och kommentarer och olika bedömningsexempel.

Skolverket avslutar uppräkningen på verktyg för likvärdig betygssättning genom att nämna stödet som de nationella proven utgör. De nationella proven ger en indikation på variatio- nen mellan skolor och lärares tolkning av betygskriterierna (Skolverket 2009).

Samtidigt förs en parallell diskussion om betygsglidningens roll för likvärdigheten inom skolan där skolverket beskriver tendensen att lärare sätter orimligt höga betyg (Skolverket 2004). Undersökningar visar på skillnader mellan nationella prov och slutbetyg. Dessa skillnader anses berättigade eller rimliga i enstaka och individuella fall men inte när det gäller en hel klass eller skola. Med detta visar skolverket först på att betygsglidningen finns och senare presenteras förklaringar till denna glidning.

Det som påverkar likvärdigheten inom ramen för betygssättning är individuella tolkningar av mål- och betygskriterier samt kursplaner relativt till elevgruppen och individuell bedöm- ning av prov (Skolverket 2007). Samtidigt visar utredningen från Skolverket (2007) att det finns förklaringar till betygsglidningen utanför ramarna för betygsbestämmelserna. Dessa är bland annat att lärare väger in faktorer som allmänna beteenden och attityder samtidigt som konkurrensen mellan skolor bidrar till variation och betygsinflation. I regeringens proposi- tion för den nya läroplanen kan en större vikt vid nationella ämnesprov och ett större krav på underlag för betygssättningen utläsas (prop. 2008/09:87). I Skolverkets utredning från 2007 diskuteras några förslag som kanske skulle leda till en större samsyn mellan lärare och

(16)

öka likvärdigheten mellan slutbetyg och prov. Krav på skriftliga motiv vid avvikande be- tygssättning jämfört med provbetygen och sambedömning av prov anses vara två av de vik- tigare punkterna för att generera likvärdighet inom skolan.

Jansdotter Samuelsson och Nordgren (2008) sammanfattar två ytterligare förklaringarna till otillfredsställande likvärdighet:

1) Brist på utbildning – Här pekat Jansdotter Samuelsson och Nordgren på ett alltför litet stöd i samband med betygsövergången, bristande stöd i formen av otillräcklig utbildning och fortbildning.

2) Konstruktionsfel på betygssystemet – Jansdotter Samuelsson och Nordgren ställer här en fråga angående förenligheten mellan likvärdighet och ett mål- och kriteriestyrt betygssy- stem. Denna fråga besvaras inte men det konstateras att betygssystemet är utformat för att

”ge information om individuella kunskapskvaliteter inte för att ge likvärdig information om ett inhämtat kunskapsmål” (Jansdotter Samuelsson & Nordgren 2008 s. 58). Detta framhål- les av kritiker som ett av de fundamentala problemen med dagens betygssystem då kravet på likvärdighet och lärarens professionalitet ställs mot varandra.

Även Korp (2006) diskuterar bristen på likvärdighet i dagens svenska betygssystem. Hon beskriver ett antal olika former av variation mellan lärare, vilka hotar likvärdigheten. Vissa av dessa variationer rör relationen till de nationella proven, så som hur lärarna bedömer elevernas lösningar och svar och hur lärarna sedan väljer att använda sig av denna bedöm- ning i betygssättningen. Lärarna väljer även att anpassa det nationella provet olika mycket till lokala förutsättningar och de aktuella elevernas villkor. Andra variationer som Korp tar upp är mer allmänna, så som lärarnas anpassning av kursen, att lärarna stundtals bryter mot reglerna för betygssättning, att elever blir godkända trots att de inte klarat kursens mål och att vissa lärare värderar beteendekriterier vid betygssättning. Denna sista punkt strider mot de gällande kursplanerna där sådana bedömningsgrunder saknas i både betygskriterier och kursmål. Det finns tendenser till att variationerna är kopplade till vilken typ av program det gäller (yrkes- eller studieförberedande) och skolmiljön (hög- respektive lågpresterande), men enligt Korp finns inga entydiga samband.

(17)

2.5 Olika typer av prov

Prov genomförs på olika sätt och med olika ansatser. Proven kan utföras skriftligt eller muntligt, gruppvis eller individuellt, vid enstaka tillfällen eller över längre tid, praktiskt eller teoretiskt (Jansdotter Samuelsson & Nordgren 2008). Andersson (1999) påpekar att proven ofta blir en kompromiss mellan olika ramfaktorer där det är vanligt att högt struktu- rerade frågor kan kompletteras med öppna svar eller kommentarer. Jansdotter Samuelsson och Nordgren (2008) lyfter syftet med prov och belyser detta med en klassisks indelning i fyra kategorier:

Diagnostisk: anger hur det nuvarande resultatet skiljer sig från det förväntade resultatet. Kan använ- das för att identifiera specifika problem som eleven kan ha.

Formativt: en bedömning som hjälper elev att lära; används tillsammans med åtgärder som är fram- gångsrika i att överbrygga skillnader mellan faktiska resultat och förväntade resultat.

Summativt: en bedömning som används för att intyga en avklarad utbildning, summera prestationer på en kurs, ge ett prognosvärde för framtida studier.

Evaluerande: information från bedömningar används för att bedöma lärares och skolors prestatio- ner. (Weeden, Winter & Broadfoot 2002, s.20, se Jansdotter Samuelsson & Nordgren 2008, s.116)

Sammantaget ser Jansdotter Samuelsson & Nordgren en historisk distinktion som skiljer traditionella prov från alternativa, där de traditionella anses vara konventionella, skriftliga och summativa och de alternativa betraktas som formativa och praktiska. De alternativa ses som mer öppna prov där eleven ges ett större utrymme samtidigt som förståelse, förtrogen- het och färdigheter testas. Till denna historiska distinktion ställer sig Jansdotter Samuelsson och Nordgren frågande och hävdar att en enklare åtskillnad vore att skilja på bra och dåliga prov. Med ett bra prov menas ett prov som ”ger underlag för att bedöma det som provet avsåg” (s.135), ett prov som ofta består av flera olika delar vilket gör att frågorna i provet inkluderar flera olika kunskapsnivåer och kognitiva nivåer (ibid).

2.6 Samstämmighet

Webb (1997) framhåller vikten av att inte bara se på ett enstaka prov utan större system av bedömningar. Enskilda prov riskerar att visa låg samstämmighet med styrdokumenten då proven ofta är för smala för att täcka in hela bedömningsområdet.

Att se till att det råder samstämmighet mellan styrdokument och bedömningsformer har en rad fördelar. Hansche (1998) sammanfattar det hela med orden:

(18)

Content standards, performance standards and assessments must be aligned so that what is taught is tested and what is tested is taught. No surprises, no questions, no controversy and no confusion. (s.

21)

Rothman (2003) pekar på hur samstämmighet försäkrar provens validitet. Näsström (2008) framhåller också samstämmighetens vikt för validiteten av tolkningen av resultat från be- dömningar, men betonar också att de två begreppen validitet och samstämmighet inte är synonymer. Validitet handlar om tolkningen av ett provresultat, samstämmighet rör även själva provet redan före någon genomfört det. (ibid.).

En annan fördel är att ett samstämmigt system på ett effektivare sätt ger möjlighet för ele- verna att nå goda studieresultat (Hansche 1998). Då prov och styrdokument är samstämmi- ga har lärare mer förtroende för dessa och använder dem i större utsträckning (Webb 1997).

Lärarna ser också till att undervisningen följer styrdokumenten i större utsträckning då de litar på att bedömningarna är samstämmiga med dessa. Dessutom har lärarna lättare att om- vandla målen i styrdokumenten och vad som tas upp på proven till konkret undervisning om länken mellan de båda blir tydligare (ibid.)

Slutligen har Näsström (2003) konstruerat en modell för att beskriva vikten av samstäm- mighet. I denna modell är samstämmigheten länkar som binder samman de tre delarna un- dervisning (teaching), bedömning (assessment) och styrdokumenten (standards). Starka länkar håller ihop de tre delarna trots påfrestningar, men en svag länk kan få hela kedjan att brytas och delarna att falla isär.

2.7 Kategoriseringsmodeller

För att analysera styrdokument och prov behövs en kategoriseringsmodell som antingen jämför de båda mot en gemensam referensram, eller jämför de båda direkt med varandra.

Det finns ett antal olika sådana kategoriseringsmodeller att välja på, bland annat Porters kategoriseringsmodell (Porter 2002), Webbs modell (Webb 1999) och Blooms reviderade taxonomi (Anderson & Krathwohl 2001, se bilaga 1). I beskrivningen nedan används en svensk översättning av Blooms reviderade taxonomi så som den presenteras i Stenlund (2006). Översättningen av Webbs och Porters begrepp står författarna av denna rapport själva för. I dessa fall finns även originaltermerna med.

(19)

2.7.1 En jämförelse

I Webbs modell jämförs provuppgifter och mål ur styrdokument i samma matris (Webb 1999). Målen står i raderna och varje kolumn motsvarar en provuppgift. Provuppgifterna kategoriseras enligt vilket/vilka mål de motsvarar och i den cell som denna träff motsvarar fylls den aktuella kunskapsdjupsnivån (depth-of-knowledge level) i. De fyra nivåer som Webb presenterar är: minnas (recall), skicklighet/begrepp (skill/concept), strategiskt tän- kande (strategic thinking) och breddat tänkande (extended thinking) (ibid.).

Porters modell och Blooms reviderade taxonomi påminner strukturellt om varandra då båda använder sig av en tvådimensionell matris för kategorisering av styrdokument och provfrå- gor separat. Båda modellerna har även kognitiv nivå som en av dimensionerna (”cognitive demand” i Porters modell och ”cognitive process” i Blooms reviderade taxonomi). Hur des- sa kognitiva nivåer är organiserade och vilka de är skiljer sig dock åt mellan modellerna.

Porters modell har reviderats vid ett flertal tillfällen, och det finns därför ett antal olika upp- sättningar av kognitiva krav. Dessutom ser kategorierna olika ut för olika ämnen. I Porter och Smithson (2001a) presenteras sju kategorier anpassade för naturvetenskap: memorera (memorize), förstå begrepp (understand concepts), utföra procedurer (perform procedures), generera frågor/hypoteser (generate questions/hypotheses), samla in data (collect data), analysera och tolka information (analyze and interpret information) och använda informa- tion för att göra kopplingar (use information to make connections). Motsvarande kognitiva kategorier i Bloom är sex till antalet, nämligen: minnas, förstå, tillämpa, analysera, värde- ra och skapa (Anderson & Krathwohl 2001). I den senare är kategorierna ordnade enligt stigande kognitiv komplexitet, från att minnas till att skapa (Näsström 2008). I båda model- lerna finns ett antal underrubriker som förtydligar de kognitiva nivåerna.

Vad gäller den andra dimensionen så finns det stora skillnader mellan modellerna. Porter väljer att använda denna dimension åt ”topics”, det vill säga specifika delområden av ett ämne (Porter 2002). Exempel på sådana delområden inom naturvetenskapen på high scho- ol, närmare bestämt inom organisk kemi, är organiska reaktioner och aromatiska kolväten (Porter 2001b). I Blooms revidera taxonomi utgörs denna andra dimension istället av olika former av kunskap: faktakunskaper, begreppskunskaper, procedurkunskaper och metakog- nitiv kunskap (Anderson & Krathwohl 2001). Dessa är, liksom gällande den kognitiva di- mensionen, ordnade från det konkreta till det abstrakta (Näsström 2008).

(20)

Näsström (2008) framhåller Blooms reviderade taxonomi som effektivare än Porters modell för samstämmighetsanalyser mellan provuppgifter och styrdokument. Detta baseras bland annat på högre reliabilitet på grund av bättre samstämmighet mellan individuella bedömare, att färre mål och uppgifter träffade flera kategorier i matrisen (multikategorisering) och på att denna modell gav upphov till färre icke kategoriserbara mål (ibid.).

Trots att Blooms reviderade taxonomi står sig bra i jämförelse med Porters modell vad gäll- er multikategorisering så ses detta ändå som ett problem då det framträder relativt frekvent (Näsström 2008). Detta bryter mot en av de fem regler som Hauenstein (1998) har satt upp för en fungerande samstämmighetsmetod, regler som Näsström (2008) använder sig av i sin utvärdering av Blooms reviderade taxonomi. Anledningen föreslås bland annat vara för breda och vaga mål i styrdokumenten, och målen i de svenska kursplanerna beskrivs som alltför ordrika (ibid.). Dock visar en annan undersökning i samma verk att ett förtydligande av målen genom uppdelning i mindre, tydligare mål ger relativt liten påverkan på multika- tegoriseringen, även om den minskade (från 89 till 60 % när det gäller antalet mål som mul- tikategoriserades av minst en bedömare). Därmed föreslås multikategoriseringen snarare bero på det aktuella ämnets karaktär (matematik), instruktionerna till bedömarna och Blooms kategorier (ibid.).

2.7.2 Allmänt om Blooms reviderade taxonomi

Redan 1956 presenterade Benjamin Bloom en modell för kategorisering av utbildningsrela- terade mål (Anderson & Krathwohl 2001). Verket där denna modell presenterades, The Taxonomy of Educational Objectives, The Classification of Educational Goals, Handbook I: Cognitive Domain (enkelt kallad the Handbook, Bloom 1956) fick stort genomslag över hela världen. Det faktum att boken har översatts till fler än 20 språk indikerar dess vida spridning (ibid.). Dock förändras synen på kunskap och lärande och därför har Anderson och Krathwohl, bearbetat denna kategoriseringsmodell för att skapa Blooms reviderade taxonomi. Den senare var även en av de bidragande författarna till den ursprungliga ”hand- boken”.

Anderson och Krathwohl (2001) beskriver ett antal skillnader mellan originalet och den reviderade taxonomin. Den största förändringen är införandet av en andra dimension, kun- skapsdimensionen. Denna har sitt ursprung i den första kategorin från den ursprungliga modellen: kunskap. Kunskapskategorin har delats upp i dels en substantivdel (den nya kun-

(21)

skapsdimensionen), dels en verbdel (den första kategorin i den reviderade taxonomin: min- nas). Även de övriga kategorierna har ändrats från substantiv till verb, till exempel har för- ståelse (comprehension) blivit förstå (understand). Anledningen till detta är en anpassning efter hur de flesta målen i styrdokumenten är utformade, där eleven skall kunna göra något (verb) med/om/i något (substantiv). Tanken är att verben skall gå att återfinna i den kogni- tiva dimensionen medan kunskapsdimensionen skall stå för substantiven. Ytterligare en förändring är att kategorierna skapa (create, tidigare synthesis) och värdera (evaluate, tidi- gare evaluation) bytt plats så att den kognitiva processen skapa nu är den mest komplexa kategorin.

Vidare skriver Anderson och Krathwohl (2001) om hur de båda versionerna av taxonomin är ordnade hierarkiskt, dock med skillnaden att den reviderade versionen inte är kumulativt hierarkiskt. Med kumulativt hierarkiskt menas att de lägre nivåerna av förståelse måste vara uppnådda för att en elev skall nå de högre nivåerna. En förutsättning för detta är icke över- lappande kategorier. Detta frångår den reviderade taxonomin ifrån genom att låta de mest avancerade delarna av en kognitiv nivå delvis överlappa de minst avancerade delarna av nästa kategori, något som beskrivs som en anpassning för att modellen ska vara mer an- vändbar i lärares praktik. Överhuvudtaget är ett av målen med revisionen att göra taxono- min mer lättillgänglig för alla typer av lärare och användbar vid planering av undervisning, styrdokument, examinationsuppgifter och samstämmighetsanalyser av dessa. Tydligt be- skrivna underkategorier till både de kognitiva processerna och kunskapsformerna är en för- ändring som gör taxonomin klarare och underlättar tolkningen av huvudkategorierna.

2.7.3 Blooms reviderade taxonomi – kunskapsdimensionen

De fyra kunskapsformerna som beskrivs i Blooms reviderade taxonomi är faktakunskap, begreppskunskap, procedurkunskap och metakognitiv kunskap (Anderson & Krathwohl 2001). Anderson och Krathwohl (2001) menar att dessa fyra former inte berör olika ämnes- innehåll, utan samma innehåll kan kategoriseras som olika kunskap beroende på vad som betonas. Olika betoning uppnås genom olika mål och metoder i undervisningen. Följande beskrivning av de fyra kategorierna baseras på Anderson och Krathwohl beskrivning av detsamma. Kunskapsdimensionen kan sägas motsvara mål-/provuppgifternas substantiv.

(22)

Faktakunskap är den mest konkreta formen av kunskap i taxonomin och kan definieras som tyd- ligt isolerbara bitar information som har ett värde i sig. Denna kategori kan delas upp i de två under-

kategorierna kunskap om terminologi och kunskap om specifika detaljer och delar. Exem- pel ur den första underkategorin är vad tecken i det matematiska språket står för och för- kortningarna för grundämnena. Exempel ur den andra kategorin datum för viktiga händelser och kunskap om ett lands viktigaste naturtillgångar.

Nästa kategori är begreppskunskap och innefattar förhållandena mellan de bitar som ingår i fakta- kunskaperna och strukturer för att ordna dessa.

Det finns tre underkategorier till begreppskunska-

pen: kunskap om klassificeringar och kategorier, kunskap om principer och generalise- ringar och kunskap om teorier, modeller och strukturer. Exempel på kunskap om klassifi- ceringar och kategorier är kunskap rörande ordklasser som verb och substantiv och känne- dom om olika geologiska tidsperioder. Exempel på kunskap om principer och generalise- ringar är kunskap om de grundläggande fysiska lagarna och Pytagoras sats. Exempel på den sista underkategorin är kunskap om genetiska modeller som DNA och hur en nations styr- ning är strukturerad och fungerar.

Den näst mest abstrakta formen av kunskap är procedurkunskaper, hur man gör något. Denna kategori inkluderar tre olika underkategorier. Den första rör ämnesspecifika färdigheter och algorit-

mer, till exempel kunskap om algoritmer för lösning av andragradsekvationer och kunskap om färdigheter som används vid målning med vattenfärger. Nästa underkategori rör ämnes- specifika tekniker och metoder, till exempel kunskap om intervjuteknik och kunskap om vetenskapliga metoder. Den sista underkategorin är kunskap om kriterier för att avgöra när man ska använda lämpliga metoder. Exempel ur denna kategori är kunskap om kriterier för att avgöra vilken metod som skall användas för lösning av ekvationer och kunskap om kri- terier för att avgöra vilken statistisk metod som är lämplig för bearbetning av insamlad data.

Minnas Förstå Tillämpa Analysera Värdera Skapa

Fakta

Begrepp

Procedur

Metakognitiv

Minnas Förstå Tillämpa Analysera Värdera Skapa

Fakta

Begrepp

Procedur

Metakognitiv

Minnas Förstå Tillämpa Analysera Värdera Skapa

Fakta

Begrepp

Procedur

Metakognitiv

(23)

Den allra mest abstrakta formen av kunskap är metakognitiv kunskap, kunskapen om både kogni- tion i allmänhet och sin egen kognition. Även här finns det tre underkategorier: strategisk kunskap,

kunskap om inlärningsfrågor inkluderat lämplig kontextuell och villkorlig kunskap och kun- skap om sig själv. Exempel på strategisk kunskap är att kunna olika minnesramsor och att känna till olika inläsningsstrategier. Exempel på den andra underkategorin är att veta att flervalsfrågor generellt ställer lägre krav på individen än öppna frågor och att veta att sam- manfattning av inlästa texter kan ge en djupare förståelse. Exempel på kunskap om sig själv är känna till sina starka respektive svaga sidor.

2.7.4 Blooms reviderade taxonomi – den kognitiva processdimensionen

Den andra dimensionen, den kognitiva processdimensionen delas in i sex huvudkategorier som i sin tur delas upp i två till sju underkategorier. Beskrivningen av dessa är hämtade ur Anderson och Krathwohl (2001). Den kognitiva processdimensionen kan sägas motsvara mål-/provuppgifternas verb.

Den minst komplexa kognitiva processen är att minnas. I detta ingår förmågan att plocka fram relevant kunskap ur minnet. Två underkategorier utgör denna kategori: känna igen och komma ihåg.

Att känna igen går ut på att jämföra information som presenteras med information som hämtas ur minnet, till exempel att avgöra om ett påstående är sant eller falskt eller utifrån ett antal alternativ välja ut vilket som är rätt. Att komma ihåg kan till exempel innebära att räkna upp viktiga exportvaror i Bolivia eller rabbla multiplikationstabeller.

Nästa huvudkategori är förstå, en bred kategori som går ut på att eleven på olika sätt ska skapa mening från information inhämtad via olika former av kommunikation. Den första underkategorin är

tolka, vilket innebär att man omvandlar information från en form till en annan, till exempel från siffror till ord eller från ord till bilder. Den andra underkategorin, exemplifiera, går ut på att kunna se vad som är specifikt för en viss princip eller ett koncept och därefter illu- strera detta med ett exempel. Den tredje underkategorin, klassificera, innebär en förmåga

Minnas Förstå Tillämpa Analysera Värdera Skapa

Fakta

Begrepp

Procedur

Metakognitiv

Minnas Förstå Tillämpa Analysera Värdera Skapa

Fakta

Begrepp

Procedur

Metakognitiv

Minnas Förstå Tillämpa Analysera Värdera Skapa

Fakta

Begrepp

Procedur

Metakognitiv

(24)

att kunna föra in information i en viss kategori. Nästa underkategori är sammanfatta och innebär att kunna komprimera och kortfattat beskriva de viktigaste delarna av ett större om- råde. Den femte underkategorin är dra slutsatser och går ut på att se samband och mönster i presenterad information. Jämföra är nästa underkategori och omfattar förmågan att hitta överrensstämmelse mellan ny information och den som redan har förvärvats. Den sista un- derkategorin som hör till förstå är förklara. Denna kategori handlar om att kunna konstrue- ra en modell byggd på orsak och verkan för att klargöra en företeelse.

Den tredje kognitiva processen som beskrivs i taxonomin är tillämpa och definieras som förmå- gan att på något sätt använda ett tillvägagångssätt för att lösa en uppgift. Här specificeras två under-

kategorier: verkställa och tillämpa. Dessa skiljs åt genom att den första behandlar kända situationer, den andra behandlar nya, mer okända situationer.

Analysera är den fjärde kognitiva processen och går ut på att kunna bryta ner presenterat material till dess beståndsdelar och därefter kunna se hur dessa delar hänger ihop med varandra och med

övergripande strukturer. Kategorin delas in i tre underkategorier. Den första av dessa är särskilja som rör förmågan att skilja på vilka delar som är relevanta respektive irrelevanta för lösande av en uppgift. Nästa underkategori är organisera och rör förmågan att strukture- ra beståndsdelarna av det presenterade materialet. Den sista underkategorin är tillskriva och handlar om att kunna läsa mellan raderna och kunna plocka ut det underliggande budskapet eller ursprungskällans åsikter ur kommunikationen.

Den kognitiva process som värderats som näst mest komplex i Blooms reviderade taxonomi är värdera. Detta går ut på att bedöma något baserat på kvantitativa eller kvalitativa kriterier och stan-

darder. Den första av de två underkategorierna är kontrollera och omfattar förmågan att i ett visst material söka efter fel så som motsägelser och vanföreställningar i förhållande till in- terna kategorier och standarder. Den andra av de två underkriterierna är kritisera och skiljer sig från den första genom att externa kategorier och standarder används som måttstock.

Minnas Förstå Tillämpa Analysera Värdera Skapa

Fakta

Begrepp

Procedur

Metakognitiv

Minnas Förstå Tillämpa Analysera Värdera Skapa

Fakta

Begrepp

Procedur

Metakognitiv

Minnas Förstå Tillämpa Analysera Värdera Skapa

Fakta

Begrepp

Procedur

Metakognitiv

(25)

Den mest komplexa kognitiva processen är skapa, genom att omorganisera eller sätta ihop olika delar skapas något för eleven nytt. Skapa delas upp i tre underkategorier: generera, planera och produce-

ra. Den första underkategorin utgörs av förmågan att se alternativ till uppgifter och dess lösningar. Fokus ligger på divergent tänkande, det vill säga att komma fram till flera olika möjligheter, och att generera hypoteser. Den andra underkategorin, planera, går ut på att konstruera en plan eller metod för hur en uppgift ska lösas genom att till exempel sätta upp delmål. Den sista underkategorin, producera, hänger ihop med föregående underkategori så till vida att den utgöra själva verkställandet av planeringen eller metoden. En beskrivning presenteras för eleven och denne ska skapa en produkt som motsvarar beskrivningen.

3. Metod

För att besvara frågeställningarna utfördes en kvalitativ analys av tre autentiska prov med hjälp av Blooms reviderade taxonomi (Anderson & Krathwohl 2001). Även styrdokument analyserades med samma metod och resultatet jämfördes med resultatet från provanalysen.

För att ge ökad bakgrundinformation genomfördes även en enkät som riktade sig mot de lärare som bidrog med prov.

3.1 Avgränsningar och urval

Med författarnas egen ämneskompetens i beaktande valdes ämnet kemi som föremål för undersökningen. Närmare bestämt valdes kursen kemi b då det är författarnas mening att det i denna kurs ges större chanser för eleverna att visa på VG- och MVG-kvalitéer än i kemi a.

Detta grundas på kursernas karaktär, kemi a består till stor del av grundläggande faktakun- skaper och begrepp, medan kemi b innehåller större möjligheter till fördjupning. Bevis för detta finns även att hitta i uppnåendemålen för respektive kurs. I uppnåendemålen för kemi a (Skolverket 2000b) används uttryck som ”ha kännedom om” och ”kunna beskriva”, me- dan uppnåendemålen i kemi b (se bilaga 2) innehåller uttryck som ”kunna tillämpa” och

”ha fördjupat sina kunskaper inom”. Denna utökade möjlighet till fördjupande frågor gyn- nar syftet med undersökning då de högre betygsstegen är i fokus.

Minnas Förstå Tillämpa Analysera Värdera Skapa

Fakta

Begrepp

Procedur

Metakognitiv

(26)

För att ytterligare avgränsa undersökningen utvaldes området organisk kemi. Detta val stöds av tre motiveringar. För det första är det ett område som tydligt beskrivs i ett av kur- sens mål: ”Eleven skall (…)ha breddat sina kunskaper om olika organiska ämnesklasser, deras egenskaper, struktur och reaktivitet samt kunna diskutera principerna för några enkla organiska reaktionsmekanismer” (kursplanen för kemi b, se bilaga 2). För det andra är det ett område som är viktigt att behärska för framtida studier inom de flesta grenarna av kemi och det underlättare även för studier inom till exempel biologi. För det tredje har båda för- fattarna erfarenhet av undervisning och provkonstruktion på området och anser att det finns goda möjligheter att ställa frågor som ger eleverna en chans att visa att de kvalificerar sig för de högre betygsstegen.

Deltagarna i undersökningen valdes ut via ett bekvämlighetsurval (Trost 2001). De krav som fanns på de svarande var att de var aktiva kemilärare och att de hade konstruerat skrift- liga prov för organisk kemi i kemi b. Informanterna var fem till antalet, aktiva i fem olika skolor i tre olika kommuner i norrland. Tre av informanterna var kvinnor, två var män.

3.2 Bortfall

Prov erhölls från fyra av de tillfrågade informanterna, en av lärarna valde att dra sig ur på ett tidigt stadium. Dock inkom ett svar så pass sent att detta prov utgått ur undersökningen, vilket ger att tre prov har analyserats. Enkätsvar erhölls endast från två lärare, trots påmin- nelser.

3.3 Analys av prov- och betygskriterier

Analysen av prov- och betygskriterier utfördes med en anpassad blandning av Webbs me- tod (Webb 1999, 2007) och Porters metod (Porter 2002; Porter et al. 2007). Båda dessa metoder är anpassade för samstämmighetsanalyser mellan prov och styrdokument, men Porters metod kan även användas för analyser av samstämmigheten mellan en lärares un- dervisning och prov eller styrdokument (ibid.). Till skillnad mot dessa två metoder använ- des Blooms reviderade taxonomi (Anderson & Krathwohl 2001) som grund för kategorise- ring av provuppgifter och betygskriterier. Denna modell har jämförts med bland annat Por- ters kategoriseringsmodell av Näsström (2008). I denna undersökning visade sig Blooms reviderade taxonomi vara mer användbar än Porters modell. I andra undersökningar i sam- ma verk visar Näsström på lämpligheten av Blooms reviderade taxonomi för analyser av både prov och mål, något som motiverar valet av modell för denna undersökning. Dessut-

(27)

om är inte de specifika ämneskategorierna som återfinns i Porters kategoriseringsmodell relevanta i denna undersökning då motsvarande detaljerade anvisningar för innehåll inte återfinns i de svenska styrdokumenten (Lpf 94). Det är inte heller denna undersöknings syfte att kontrollera det ämnesmässiga innehållet i provet, utan vilken form av kunskap som efterfrågas, och det är detta som Blooms reviderade taxonomi tar upp.

De utvalda undersökningsdeltagarna kontaktades via telefon med en förfrågan om delgivel- se av prov. I de flesta fallen skickades även en skriftlig bekräftelse via e-post. Då proven erhållits fördes varje fråga in i matrisen efter vilken kognitiv process och vilken typ av kun- skapsdimension som efterfrågades (Anderson & Krathwohl 2001, se 2.7.3 Blooms revide- rade taxonomi – kunskapsdimensionen och 2.7.4 Blooms reviderade taxonomi – den kogni- tiva processdimensionen). De kognitiva processerna behandlades som en hierarki, vilket medförde att endast den högsta nivån i en fråga noterades. Ett exempel på detta är uppgifter där eleven måste komma ihåg faktakunskaper (minnas) för att kunna dra slutsatser (förstå).

I dessa fall registrerades alltså den kognitiva processen ”förstå”. Bhola, Impara och Buck- endahl (2003) framhåller vikten av att bara se till de högsta kognitiva nivåerna för att und- vika irrelevanta träffar, och Webb (1999) drar samma slutsats efter att ha studerat problem som kan uppstå vid analysen.

I vissa provuppgifter efterfrågas flera olika processer och/eller kunskapsformer explicit, och i dessa fall gav uppgiften upphov till flera träffar i matrisen. Detta innebär att vissa uppgifter får en större inverkan, något som speglar att de i själva verket är mer komplexa och består av flera uppgifter. Ett alternativ till detta är att uppgifterna tilldelas olika vikt beroende på antalet poäng de är värda i provet (Porter et al. 2007). Det senare tillväga- gångssättet är dock av större vikt då balansen i ett prov ska undersökas och ansågs inte re- levant i denna undersökning.

De absoluta värdena på antalet träffar räknades om till ett relativt mått genom att det totala antalet träffar för en viss cell dividerades med det totala antalet träffar i hela matrisen. Detta möjliggör jämförelse av matriser innehållande olika totalt antal träffar (Porter et al. 2007).

Betygskriterierna för kemi b analyserades enligt samma metod. Därefter kunde de relativa värdena jämföras mellan betygskriterierna och proven och internt mellan proven. Överens-

(28)

Samstämmighetsindex =

stämmelsen, eller samstämmigheten, mättes med Porters (2002) ”samstämmighetsindex”

(alignment index) enligt följande:

1 Σx −2 y

Där x är en cells relativa värde i en matris och y är en samma cells relativa värde i en annan matris. (Porter 2002). En matris kan exempelvis vara analysen av ett prov och en annan matris kan vara analysen av ett styrdokument. Det resulterande värdet ligger mellan 0 och 1, där 0 indikerar total brist på samstämmighet och 1 indikerar fullständig samstämmighet.

Gränser för vad som är en acceptabel samstämmighet saknas i Porters modell (se till exem- pel Porter 2002 och Porter et al. 2007). Webb (2007) använder ett motsvarande index (”ba- lance index”) och i detta fall används ett gränsvärde på 0,7 för vad som anses vara en ac- ceptabel nivå av samstämmighet (ibid.).

Samma formel kan användas under för att fastställa samstämmigheten mellan olika tolkare av samma material (Näsström 2008). För att öka reliabiliteten gjordes analysen av proven enligt Porter et al. (2007) individuellt av de båda författarna och interbedömaröverens- stämmelsen kontrollerades sedan genom beräkning av samstämmighetsindex. Ett snitt av de båda bedömarnas resultat räknades ut för varje cell och det var dessa värden som användes för fortsatta analyser (Porter et al. 2007; Webb 1999, 2007). Att räkna ut ett snitt av bedö- marnas resultat ökar reliabiliteten genom att enskilda bedömares misstag delvis korrigeras (Webb 1999). Analysen av betygskriterierna genomfördes dock i samråd, i likhet med den metod som Webb (1999, 2007) presenterar. Detta leder dels till en ökad förtrogenhet med det studerade materialet, dels till en bättre förståelse för de olika kognitiva nivåerna (Webb 1999).

Ytterligare ett tillvägagångssätt som ökar reliabiliteten är att låta bedömarna träna på analy- ser innan de börjar på de dokument som skall ingå i undersökningen (Bhola, Impara &

Buckendahl 2003; Webb 1999). Träningens syfte är att bedömarna ska öka sin förståelse för den modell som används och att gemensamma riktlinjer kring bedömningen skall upp- rättas (Bhola, Impara & Buckendahl 2003). Träning minskar också antalet irrelevanta träf- far till följd av registrering av underliggande kognitiva processer (Webb 1999). Inför analy- serna i detta arbete tränade bedömarna på andra ämnens betygskriterier och andra prov

References

Outline

Related documents

När känslan av att inte ha kontroll var hög och nära till panik ville en del patienter ta kontroll över situationen genom att ställa frågor för att få detaljerad information

QU* regula circa plures rationes? Refp, Licet. una ratio ceffet, non ilatim

Tomas Englund Jag tror på ämnet pedagogik även i framtiden.. INDEX

Det finns en hel del som talar för att många centrala förhållanden i skolan verkligen kommer att förändras under åren framöver:... INSTALLATIONSFÖRELÄSNING

Val av metod gjordes då studien syftade till att öka vår förståelse för hur olika diskurser genom socialt samspel konstrueras på Flashback Forum.. Fortsättningsvis gjordes

Dessutom uttrycker sig eleven med viss säkerhet i tal och skrift samt använder matematiska symboler och andra representationer med viss anpassning till syfte och situation. Genom att

Detta kan kopplas till att förskollärarna, med god kvali- tet arbetar med de strävansmål som är kopplat till teknik: att alla barn ska utveckla sin förmåga till att

livssituation som lyfts fram i temat om äldre som offer, eller den bild av de äldre med omsorgsbehov som beroende av andra människor som lyfts fram i temat om äldre som