RELATION TILL PEDAGOGISK FORSKNING - Utvärdering av undervisning: en problemanalys och några em

Innan vi mer ingående behandlar olika områden inom utvärdering vill vi penetrera den begreppsförbistring som gäller vid användandet av begreppen "utvärde

ring" och "pedagogisk forskning".

Åsikterna om vad som bör ingå inom ramen för peda

gogisk forskning är emellertid många och skiftande (t ex Kerlinger, 1969; Lundgren & Wallin, 1973;

Taylor, 1973). De flesta är överens om att syftet är att erhålla ny kunskap som är generaliserbar och att man får sådan kunskap genom att använda så adekvata och säkra metoder som möjligt. Däremot

syfta till kunskap som förenklat uttryckt innebär ett "förklarande" av pedagogiska fenomen eller ska den syfta till "förståelse" av ifrågavarande feno

men? Ska forskningen fortfara att utgå från psyko

logi och sociologi vad gäller variabelval, teorier, begrepp och metoder eller försöka ta fasta på sådant som är specifikt pedagogiskt? Forskarens syn på frå

gor av den arten blir bestämmande för uppläggning, undersökningsstrategi och analysförfarande i varje enskild studie.

Då också utvärderingsbegreppet är tänjbart (s 11-16) är det svårt att göra generella jämförelser mellan forskning och utvärdering. Den skillnad som brukar åberopas är att intentionen inte är densamma för de båda aktiviteterna. I stället för att primärt utgå från en strävan efter kunskap som är generali-serbar syftar man i utvärdering främst till att in

förskaffa information som är mer situationsspecifik (bl a Welch, 1969; Benedict, 1970; Marton, 1973a).

Skillnaden är oklar på den punkten, då det i o lika utvärderingsstudier uttrycks varierande förhoppning om att kunna dra nytta av kunskaper och erfarenheter från en utvärdering till en annan (Brown, 1972).

Det kan t ex gälla vissa nyckelvariabler, principer, icke förväntade effekter, undersökningstekniker som prövats eller strategier som tillämpats.

•aktat svårigheterna har olika försök gjorts för att särskilja utvärdering från pedagogisk forskning.

Baker (1969) har, utifrån de termer författarna an

vänder i t itlar och de operationella definitioner av termerna som brukas, försökt placera evaluerings-studier i e n kategori och läroplansforskning i en annan. Någon större skillnad kunde emellertid inte noteras mellan de båda undersökningstyperna.

Systematiska sammanställningar förekommer, där man utgått från aktiviteter som anses typiska för forsk

ning respektive för utvärdering (Hemphill, 1969;

Morgan, 1971). Uppställningarna behandlar forskning å ena sidan och utvärdering å andra sidan som om åt

skillnaden vore helt klar. Man tycks därmed se peda

gogisk forskning som liktydigt med grundforskning under goda kontrollbetingelser samtidigt som man an

tar att sådana betingelser saknas i utvärderings-studier. Vid en närmare granskning framstår svårig

heterna med att göra en sådan dikotom indelning ganska klart. Det förefaller oss mer adekvat att placera de aspekter som brukar tas med längs ett kontinu um:

Den kunskap som utvinns är mer eller mindre direkt tillämpbar. De problem som studeras är mer eller mindre programhärledda. Bedömningsegenskaper är mer eller mindre utmärkande för olika studier. Ori

entering mot mikro-respektive makronivå varierar.

Utvärdering liksom pedagogisk forskning kan båda vara mer eller mindre flexibla till sin upplägg

ning. Tonvikt på kvantitativa respektive kvalita

tiva data är inte heller något som kan sägas vara reserverat för forskning respektive för utvärdering.

I det sammanhang då Weiss (1972) tycker sig ana att utvärdering betraktas som en lägre ordningens forsk

ning och försvarar utvärderingsstudier mot sådana antydningar likställer även hon forskning med grund

forskning. Hänvisning görs till de stora svårigheter utvärderaren har att brottas med:

"It is relatively easy to run experiments in an in-sul at ed laboratory with captive subjects. But to make research work when it is coping with the com

plexities of real people in real programs run by real organizations takes skill - and some guts"

(s 9).

Vissa av de författare som ofta återkommer inom ut

värderingsområdet har sökt klargöra vad man menar med forskningsintresse och vilken roll detta bör spela i utvärderingsarbetet. Astin och Panos är ex

empel på utvärderare som betonar en forskningsansats i arbetet. De klassificerar den information som lig

ger till grund för beslut i utbildningsfrågor ef

ter hur sådan information insamlas och skiljer här

vid mellan "folklore", anekdotisk information, de

skriptiv information och forskningsinformation.

Risk föreligger att beslutsfattaren explicit eller implicit "konstruerar" kausala samband om endast deskriptiv information finns att tillgå. För Astin och Panos är det därför av stor vikt att försöka ersätta övriga typer av information med forsknings

data, vilket innebär att antaganden om kausalsam-band penetreras och empiriskt prövas av evalueraren (Astin & Panos, 1971).

Den beskrivning som Parlett och Hamilton ger av ut

värderarens uppgifter visar att de önskar införskaf

fa forskningsinformation vid utvärdering. Förutom att utreda den komplexa situation utvärderaren mö

ter, ska han isolera dess viktiga drag, försöka fastslå orsaker och effekter, försöka förstå sam

bandet mellan teori och praktik och mellan organisa

toriska mönster och individreaktioner (Parlett &

Hamilton, 1973).

Den modell som utarbetats av Stake (1967) genomsy

ras Qckså av stort forskningsintresse (s 27).

Stake tycks-dock ha intagit en#annan position i nu

läget jämfört med när han presenterade sin utvärde

ringsmodell. Forskningsintresset är ej längre lika märkbart och synsättet karaktäriseras av en starka

re inriktning mot att ge bedömningsunderlag för en viss specifik situation (Stake, 1973b). I ett gen-mäle till Astin och Panos poängteras att forsk

ningsinformation inte är klart överlägsen andra in

formationskällor och ej heller har påvisats vara mer användbar. Scriven uttrycker också reservationer in

för att forskningsintresset helt ska dominera utvär

dering. Han menar att ansträngningar att finna förkla

ringar inte får ges alltför stort utrymme i utvärde

ringsarbetet. Förklaringar är lika sekundära för eva-luering som terapi för diagnos (Scriven, 1969). Det senaste yttrandet är något svårbegripligt sett mot att Scriven starkt betonar bedömningsaktiviteten i utvärdering. Dm utvärderaren inte försökt belysa varför observationerna av ett pedagogiskt fenomen gi

vit ett visst utfall får bedömningsunderlaget reduce

rat värde och kan ibland leda till att missvisande värdeomdömen avges.

På en del håll har man dragit konsekvenserna av svå

righeterna med att dra vattentäta skott mellan be

greppen utvärdering och forskning. Bl a Suchman (1967) och Weiss (1972) föredrar att tala om utvär

deringsforskning i s tället för om utvärdering. Där

med vill de tillika betona forskningsinslaget i ut

värderingssammanhang. En fruktbarare ansats än att försöka sätta etiketten "forskning" eller "utvärde

ring" på utförda undersökningar torde vara att dis

kutera pedagogiska problem på ett mer genomgripande sätt Î

"Inom pedagogiska forskningskretsar har man talat om skärpt metodik^snya forskningsstrategier och nya in

fallsvinklar på gamla problem. Den diskussionen är angelägen och relevant oavsett om forskningen kallas

9besl.utsorienterad ⁹eller ⁹s lut s at sor i ênt er ad ⁹"

(Barglund, 1971, s 33).

Däremot torde det vara angeläget att påpeka det öm

sesidiga utbyte som så kallad slutsats- och besluts-orienterad forskning kan ha av varandra. Detta görs också av flera författare. Westbury hänvisar till de bidrag söm t ex KOMPASS-projektet (bl a Dahllöf, 1967; Dahllöf & Lundgren, 1970) kan ge å ena sidan

men betonar också utvärderingsforskningens möjlig

heter att ge betydelsefulla tillskott till andra ty

per av pedagogiska undersökningar (Westbury, 1970).

En utvärderingsstudie kan utgöra en prövning av forskningsresultats generaliserbarhet genom att den bedrivs i e n mindre artificiell situation (Hemphill, 1969). Forehand (1966) ger uttryck för en stark tro på att utvärdering kan bidra till att öka vetandet om och förståelsen av undervisningsprocessen. Samla

de ansatser krävs för att bättre besvara grundläg

gande frågor i pedagogik. Utvärderingsforskning kan förhoppningsvis leda fram till kunskaper som rör

"vilken metod är bäst för vilket syfte för vilka elever under vilka betingelser" (Marton, 1973a, s 341).

Vår diskussion om förhållandet mellan utvärdering och forskning ska ses mot bakgrund av det vi tidigare framfört om ett tilltagande intresse för och en ök

ande omfattning av evaluering (Del I). I och med att utvärdering på senare tid allt mer kommit att fram

stå som ett specialområde kan numera en undersökning rubriceras såsom utvärderingsstudie, vilket ej hade varit fallet för ett tiotal år sedan. Den tillämp

ningskaraktär som utmärker en stor del av det pedago

giska forsknings- och utvecklingsarbetet gör att många studier skulle kunna inlemmas under rubriken utvärdering. Ibland tycks det vara ett mer eller mindre godtyckligt val om man föredrar att kalla sitt arbete för forskning eller utvärdering. Med be

aktande härav är Bakers resultat (s 20) inte särskilt förvånande. Vår åsikt är att man genom att ta sin ut

gångspunkt i problemet och sätt att lösa detsamma bidrar till ett givande och ett tagande undersök

ningar emellan vare sig de benämns forsknings- eller utvärderingsstudier.

Det centrala för utvärderingsförfarandet är i stäl

let vilka ställningstaganden som görs i vissa grund

läggande frågor. I samband med att vi försökt klar

göra bakomliggande syfte med evaluering (s 12) har vi t ex intagit en position som får konsekvenser för vårt sätt att utföra en evalueringsstudie. Då vi besvarar frågan om utgångspunkter för verksamheten (jfr s 20) med att vi vill försöka att ta fasta på ett antal pedagogiska begrepp får också detta åter

verkningar. Att vi genom utvärderingen önskar ernå kunskap som inte endast har relevans för den aktu

ella situationen utan som också kan vara betydelse

full för ett framtida agerande medför tillika vissa följder för det empiriska arbetet.

EXEMPEL PÂ OCH TILLÄMPNINGAR AV UTVÄRDERINGSMODELLER

Inget av de angreppssätt som var dominerande fram till 1960-talet kunde tillmötesgå de krav som ställ

des på utvärderingar bl a i Elementary and Secondary Education Act (ESEA 1965) i USA. ESEA kom att med

föra att frågan om vad evalueringsprocessen inne

bär kom i blickpunkten. Härvid nyskapades ett an

tal nya utvärderingsmodeller samtidigt som några av de tidigare ansatserna utvecklades (SRIS Quarterly, 1972) .

Modellerna kan grupperas utifrån vad som betonas vid utvärdering. Det är fyra olika inriktningar som i huvudsak gäller och under vilka modellerna kan in

ordnas. Redan tidigare har två av angreppssätten be

rörts nämligen (1) "expert-utlåtande"-mode 1len och (2) "må Ire laterings"-modellen. Inom den senare var Tyler (1942) pionjär, men samma strategi är utmärk

ande för flera andra forskare, Modifierade målmo

deller har utarbetats av Metfessel % Michael (1967), av Hammond (1969) och av Provus {1969), Den tredje ansatsen kan kallas (3) "beslutslednings*-modellen.

Stufflebearos modell (I960) ingår här som den mest genomarbetade och även den mest välbekanta model

len. De angreppssätt som Seriven (1963) och Stake

(1967) framför kan innefattas under benämningen (4)

"bedömnings"-strategin.

Sanders och Worthen (1972) har utarbetat en samman

fattande beskrivning av de viktigaste utvärderings -aspekterna inom de olika inriktningarna. De har ta

git med fyra representanter tillhöriga "målrelate-rings"-modellen. I den översikt som följer (s 27-28) ges endast två exempel på forskare som betonar mål för att undvika att ge just denna ansats allt

för stor vikt. Vår uppställning bygger i f örsta hand på Sanders och Worthens arbete, men även den samman

ställning som Stake har utarbetat (Stake, 1973b) har beaktats. Vad som skiljer beskrivningarna av Stake respektive av Sanders ä Worthens åt är att de senare beaktar fler aspekter och fler representan

ter. Ursprungliga källor for översikten (s 27-26) är Tyler, 1942; Metfessel & Michael, 1967; Stuffle-beam, 1968, 1969; Scriven, 1967, 1972; Stake, 1967, 1973b.

n O-H -H

w ro 4 ->

(1) Exempel på tillämpning av expertutlåtande-model

len i S verige är närmast inspektörsverksamhet av oli

ka" typ t ex skol- och gymnasieinspektörer. Någon di

rekt motsvarighet finns inte på universitetsnivå. På samtliga skolnivåer bidrar de flesta som är inkopp

lade i u ndervisningen med uppgifter som möjliggör utvärdering av detta slag. Uppgifter lämnas t ex om resultat på standardprov och centrala prov och från universitetsinstitutionerna ges uppgifter om studieresultat, som sammanställs i form av genom

strömningsstatistik. Syftet härmed är att få en grov uppfattning om hur undervisningen fungerat. Expert

modellen nyttjas även i a nnat syfte nämligen för att vara till direkt hjälp för undervisare eller bliv

ande undervisare. Konsulenter som är ämnesexperter respektive metodiklektorer avses fylla en sådan funktion. Inom universitetet kan viss del av de lo

kala PU-enheternas verksamhet utgöra en parallell härtill.

Utvärderingsrapporter som bygger på modellen har vanligen en översiktlig och kritisk uppläggning, varvid man ofta utgår från redan befintliga data och från erfarenheter som experter inom olika om

råden redovisat. Colemans studie (1966) i U SA liksom Bengtssons studie i S verige (1972) men också ana

lyser som t ex Postman & Weingartner (1973) och Holt (1974) utfört kan hänföras till evaluering av denna typ (jfr Nordén, 1974). Bland annat be

roende på dess ibland bristfälliga empiriska un

derlag jämställs inte alltid utvärdering enligt s k expertut lätande-mode 11 med utvärderingsstudier i egentlig mening (s 14). Analyser och rapporter av ovan nämnda slag spelar en viktig roll genom att de kan tänkas initiera till debatt om grundlägg

ande pedagogiska frågor.

(2) Den modell som blivit föremål för forskarnas stora intresse har varit den s k m

ålrelaterings-modellen som ibland också kallats för-efter-teststra-tegin. Projektet Nåtional Assessment of Educational Progress (Tyler, 1966) liksom operation Head Start (Smith & Biseli, 1970) står i linje med modelle-n.

Här i landet kan vissa utvärderingar inom TRU-sek-torn representera undersökningar av detta slag (SOU 1973:19). Det av SÖ initierade MUT-projektet

tycks också syfta till utvärdering enligt målrelate-ringsmode1len (Skolöverstyrelsen, 1974). Invändning

ar mot de utvärderingar som impliceras rör i f örsta hand begränsningar som följer av att undervisnings

processen inte studeras tillika med att mål och test ofta inskränks till att gälla specifika kognitiva prestationer (jfr s 18). Vi återkommer senare till en närmare behandling av begränsningar som vidlåder programutvärderingar utifrån denna modell.

(3) Stufflebeam vände sig mot att utvärdering inte i f örsta hand var inriktad mot sådana variabler som beslutsfattare kunde kontrollera. Hans CIPP-mo-dell blev mycket populär under ett flertal år fram

för allt i U SA, men dess popularitet har sjunkit.

En förklaring härtill är att modellen ändå inte gav den information som de administrativa beslutsfat

tarna behövde. Stake (1974a) menar att så länge som beslutsfattarna inte betraktade det egna handlandet som en del i utvärderingen måste modellen resultera i ett misslyckande. En annan förklaring till att entusiasmen för ClPP-modellen avtagit ger Plajer (1972). Han redovisar erfarenheter av att ha arbe-tat,utifrån CIPP och hans slutomdöme är att model

len är alltför svår vid praktisk tillämpning. Fort

löpande, förvirrade diskussioner rörde t ex om giv

na aktiviteter skulle föras till ena eller andra typen av evaluering, vilket inte ledde fram till nå

got fruktbart utbyte för deltagarna.

(4) Scriven och Stake har i viktiga avseenden sam

ma syn på utvärdering. Båda betonar holistisk

ut-värdering och båda betonar att utvärderaren måste av

ge klara bedömningar av värdet hos olika aktiviteter och företeelser i undervisningen. Såväl Scriven som Stake har⁴haft stort inflytande på andra utvärderare.

Knappast någon bok eller artikel som rör utvärdering saknar referenser till dessa båda. Hos den förre är det oftast distinktionen mellan formativ och summa-tiv evaluering man hänvisar till.

U969 poängterade Scriven det centrala i att klargö

ra målsättningen med utvärderingen och i s amband härmed den roll som utvärderingen eller utvärdera-ren bör spela. Den avsedda innebörden i f ormativ och summativ evaluering antyds i terminologin.

Formativ utvärdering sker medan man håller på att forma programmet, skolsystemet eller läromedlet. Ge

nom att utvärderaren successivt ger information hop

pas man åstadkomma förbättringar. Vid summativ eva

luering summeras intrycken av en slutprodukt. Begrep

pen tycks direkt svara mot de två syften med utvär

dering som Hastings angav (1966) nämligen revision och adoption. Formativ utvärdering kan tillmätas en vägledande och summativ en kontrollerande funktion (Marton, 1973a).

Distinktionen mellan formativ och summativ evalue

ring bedöms oftast som användbar och viktig att göra.

Olika utvärderare lägger dock varierande vikt vid att särskilja begreppen. För Scriven är de viktiga därför att de implicerar olika undersökningsstrate

gier. Med ett formativt syfte blir det nödvändigt att noggrant beskriva olika aktiviteter i u ndervis

ningen (intrinsic evaluation) medan man med ett sum-mativt syfte koncentrerar sig på att undersöka ef

fekterna av denna (pay-off evaluation). Kosecoff och Fitz-Gibbon (1973) hör också till dem för vil

ka distinktionen har central betydelse. De framför att det är ohållbart att samtidigt tjäna två her^

rar. Att som vid formativ utvärdering arbeta i nä

ra relation till t ex lärare och som vid summativ utvärdering förhålla sig objektiv, att samtidigt be

trakta programmet som avslutat och icke-avslut at respektive som statiskt och i eke-stat iskt måste re

sultera i " formativ-summativ-schizofreni^w. Distink

tionen mellan de båda »valueringstyperna har dock inte uppfattats på ett entydigt sätt. Sanders och Cunningham (1973), Westbury (1970) och Weiss (1972) hör till dem som noterat oklarheter främst i begrep

pet formativ utvärdering. Nedan Wiley (1969) talar om att göra summativ evaluering formativ diskute

rar Grobman (1970) begreppen utifrån en tidsdimen

sion och menar att formativ utvärdering är aktuell även då ett projekt går in i en summativ fas. Det är relativt sällsynt med beslut av typ "go/no go, live-or-die" (Weiss, 1972). Det är således tvek

samt om undervisningsprogram överhuvud kan ses som en färdig produkt som inte kräver fortsatt föränd

ring och anpassning. För att ha underlättande och inte förvirrande verkan menar vi att begreppen in

te bör tillskrivas en art- utan snarare en grad

skil 1 nad.

I skillnaden mellan formativ och summativ utvärde

ring ligger också att gruppen av intresserade lä

sare är mindre vid formativ evaluering beroende på det specifika sammanhang som den utförs i. Genera-liserbarheten är låg (Stake, 1974a). Detta åter

speglas också i u tvärderings 1itteraturen. Medan de formativa utvärderingarna utgör en allt större del av de studier som genomförs rör de flesta under

sökningar som publicerats summativa studier (Welch, 1969). The IPI Evaluation Program är dock exempel på omfattande rapportering av utvärdering med hu

vudsakligen formativt inslag (Lindvall & Cox, 1970).

I Sverige finns formativa studier utgivna främst in

om läromedelsområdet (Nordén,- 1971; SOU 1973:19;

Wallin et al., 1971). Utvärdering av summativ art är exempelvis UEA-projektet (Elgqvist-Saltzman,

1972, 1973a) och DU-projektet (Franke-Wikberg et al., 1972c).

Det man oftast refererar till hos Stake gäller den utvärderingsmodell som presenteras i artikeln "The Countenance of Educational Evaluation" (1967). Trots att Stake i vissa avseenden förändrats i s in syn på utvärdering vidhåller han att de idéer som häri framlades är goda och användbara vid planering av utvärdering. Det har dock bedömts som mindre lämp

ligt att benämna en av matrisens kolumner "observa

tioner" beroende på att alla data numera ses som ob-servationsdata (Stake, 1974a). Medan Scriven främst är teoretiker är Stake både teoretiker och praktiker.

Vid utvärderingen av TCITY (the Twin City Institute for Talented Youth) har han försökt tillämpa nämnda utvärderingsmodell (Stake & Gjerde, 1973).

I TCITY-rapporten kan man inte se direkta motsvarig

heter till modellens kategorier, men grundidéerna avspeglas dock. Förutsättningarna för undervisning

ens genomförande och de allmänna målsättningarna be

skrivs och bedöms av utvärderaren. Elevgruppernas intentioner och utmärkande drag redovisas och klas

serna kommenteras som helhet av typ "en rolig klass".

Programaktiviteterna beskrivs och bedöms ur olika perspektiv. Utvärderaren bedömer aktiviteterna som deltagande observatör, enstaka elever porträtterar olika företeelser, grupper av elever lämnar attityd

svar och lärare ger sin syn på undervisningsprogram

met. Rapporten avslutas.med en summering av dels det mest positiva och dels det mest negativa som kan an

föras ("de motsatta-åsikternas-teknik").

Om vi applicerar "de motsatta-åsikternas-teknik" på rapporten kan det å ena sidan sägas att den är lättillgänglig, omväxlande och livfull och att den ger en mångfacetterad, översiktlig bild av program

met. Â andra sidan utmärks rapporten av att vara

mycket subjektiv. Det finns risk för att vad som blir avgörande för hur programmet presenteras är

In document Utvärdering av undervisning: en problemanalys och några empiriska studier på universitetsnivå (Page 35-60)