• No results found

5. Metod

5.4. Reflektioner kring tillförlitlighet

5.4.2. Validitet

Validitet, eller tillförlitlighet, är ett mått på hur väl studiens resultat mäter det som den avser att mäta (Cohen, Manion & Morrisson, 2011; Onwuegbuzie & Johnson, 2006).

Validitetsbegreppet kan delas i ett flertal underliggande begrepp som berör olika aspekter av ett undersökt fenomen, till exempel begreppsvaliditet (hur väl studien mäter de begrepp som den avser att mäta) och face validity (att studiens respondenter uppfattar en uppgift som relevant för att testa det som uppgiften säger sig vill testa). Med utgångspunkt från dessa validitetsbegrepp så har föreliggande studie använt sig av ett förberedande pilottest för att få en bild av respondenters uppfattningar om testet, samt vänt sig till tidigare forskning kring kreativitet och historiskt tänkande för att kunna konstruera en historieuppgift som är relevant i sammanhanget.

I den här studien undersöks samband mellan kreativitet och kontinuitet och förändring, mer specifikt vilka likheter och skillnader som kan föreligga mellan de båda begreppen.

Denna form av samband särskiljs i den här studien från kausala samband. I min undersökning så görs visserligen bakomliggande antagande kring att kreativitet och historiskt tänkande med fokus på kontinuitet och förändring kan påverka varandra, men dessa antaganden undersöks inte närmare här. Eftersom jag inte använder mig av en slumpmässig fördelning av respondenter till olika experimentgrupper med kontroll för störande variabler så har jag svårt att uttala mig kring kausalitet (Shadish, Cook &

Campbell, 2002). Den historiska förståelsen skulle till exempel orsaka kreativitet, men även det motsatta skulle kunna vara gällande. Dessutom så skulle potentiella samband mellan kreativitet och historisk förståelse kunna förklaras av underliggande variabler som den här studien inte har räknat med. Följaktligen så kan den här studien ge upphov till kausala hypoteser som kan testas i framtida forskning, men har svårt att uttala sig om ett begrepp som inre validitet.

I anslutning till diskussioner om validitet så skulle en potentiell begränsning kunna vara att respondenterna hade begränsat med tid på sig att genomföra uppgiften (20 minuter). På så sätt är det möjligt att eleverna inte kunnat utvecklat sina resonemang i en tillräcklig hög grad för att kunna visa upp kreativitet och historiskt tänkande i studien. Ett domänanpassat test likt det som användes i denna studie förlitar sig också mer på ämneskunskap än

traditionella ämnesövergripande kreativitetstest, något som skulle kunna göra det svårare att generera tillräckligt många svar för att kunna testa effekter av till exempel divergent tänkande i föreliggande studie. Sådana resonemang skulle kunna tas som argument för att historieuppgiften i den här studien inte har tillräcklig hög validitet för att kunna testa kvantitativa effekter.

Som ett motargument till denna kritik så fanns det ingen statistisk skillnad i bortfall eller utförlighet mellan början och slutet på uppgiften vilket skulle kunna motsäga argumentet

om bristande skrivtid. Det fanns inte heller någon homogen samling kring ett maxvärde gällande antalet slutsatser per elev vilket skulle kunna tyda på att det inte fanns någon begränsande takeffekt bland respondentsvaren. Dessutom så fanns det en stor spridning på mängden svar i linje med statistiska normalfördelningskurvor i insamlat material. Slutligen så gjordes ett beslut att vara så lik verkliga historieuppgifter som möjligt. Det är till exempel möjligt att verkliga begränsningar i form av ett komplext ämnesstoff, brist på tid och domän-specifik kunskap gör att kvantitativa effekter inte återfinns i någon högre grad i vardaglig historieundervisning med fokus på kontinuitet och förändring. Trots dessa argument så går dock inte att utesluta att skrivtiden kan ha begränsat respondenterna vid genomförandet av historieuppgiften.

Andra begränsningar i den här studien berör undersökandet av den subjektiva

kreativiteten. Visserligen så finns det en styrka i att inkludera elevernas egna bedömningar i studien eftersom elevernas egna värderingar får komma till tals och den subjektiva

kreativiteten utgör ett viktigt komplement till andra mer objektiva former av kreativitet (se sid. 27-28 för vidare diskussioner kring betydelsen av att se på kreativitet från olika

perspektiv). Mätandet av subjektiv kreativitet riskerar dock att påverkas av de begräsningar som brukar förknippas med självskattning (Kaufman, 2019). Eleverna skulle till exempel kunna värdera det egna svaret som mer social önskvärt än vad som vore fallet om de inte hade behövt visa upp sin värdering. En annan begräsning gäller den relativa bristen på information som de två självskattningarna av originalitet (i vilken grad som eleverna ansåg sig ha lärt sig något nytt efter genomförd historieuppgift) och meningsfullhet (i vilken grad som eleverna ansåg sig ha lärt sig något nyttigt efter genomförd historieuppgift) kan ge. Här resulterade elevernas självskattningar endast i numerära värden. Visserligen så innebar det att eleverna kunde genomföra skattningarna på en relativt kort tid, vilket ansågs vara nödvändigt eftersom eleverna vid tidpunkten för självskattningen redan genomfört större delen av historieuppgiften, men det hade varit fördelaktigt att få reda på mer information om vad som låg bakom dessa skattningar. Hur tolkade eleverna i den här studien till exempel begreppet nytta? Här kan eleverna ha syftat på en rad olika saker, så som nya historiska faktakunskaper, sambandet mellan dåtid och nutid eller någon annan

kombination av historiska perspektiv. En mer utförlig information om vad som låg bakom eleverna självskattningar hade även kunna ge insikter kring elevernas intentioner att vara kreativa. Eftersom eleverna endast ombads värdera sina svar i sin helhet så kan det vara svårt att veta vilka slutsatser i de egna svaren som eleverna tänkte på som underlag för den egna kreativitetskattningen. Följaktligen så har den här studien svårt att undersöka i vilken

omfattning som självskattningarna baserade sig på just de kreativa slutsatserna i elevernas svar.

Ytterligare andra validitetsaspekter med betydelse för den här studien utgörs av

triangulering, självkritisk granskning och antalet respondenter. Med triangulering menas en avsikt att undersöka ett fenomen från olika perspektivför att kunna visa på en innebördsrik och mångfacetterad beskrivning av det undersökta fenomenet. Här har jag försökt att undersöka hur kreativitet gestaltas inom det historiska tänkandet kontinuitet och förändring från en rad olika perspektiv, så som subjektiv, objektiv och kognitiv kreativitet. Denna mångfald av perspektiv syns även i inkluderandet av olika respondenter (elever från olika program) och analysmetoder (kvalitativ och statistisk analys). Här har jag försökt upprätta en balans mellan en precis undersökning med möjligheter att kunna fånga in nyanser och komplexitet och möjligheterna att förstå sambandet mellan kreativitet och kontinuitet och förändring på ett tydligt och lättillgängligt sätt.

En annan validitetsaspekt utgörs av en självkritisk granskning. Här har jag försökt vara medveten om att viss data kan få oproportionerligt stor påverkan på slutsatserna, i

synnerhet data som stödjer min förförståelse (s.k. researcher bias). Denna förförståelse kan även göra att jag omedvetet anpassar tolkningar av data för att passa förutfattade meningar.

I ett försök att möta denna inverkan så har jag försökt att medvetengöra min förförståelse, till exempel min syn på kreativitet som vardaglig, abstrakt och svåråtkomlig, och leta efter motsatta perspektiv till preliminära tolkningar av insamlad data (s.k. negative case analysis).

En strikt objektiv undersökning är dock inte möjlig och det går inte att komma ifrån att den här studiens upplägg och analys är under inflytande av just mitt personliga

förhållningssätt till såväl forskning som kreativitet och historiskt tänkande.

Slutligen så har jag försökt att rekrytera tillräckligt med respondenter i studien, totalt 92 medverkande, för att kunna ha en rimlig chans att besvara uppställda frågeställningar. Här har jag försökt uppnå en mättnad i analyserat material (en punkt då vidare analyser liknar de tidigare och inte längre tillför något nytt) och en tillräcklig hög statistisk styrka/Power. Här utgick jag från en rekommendation på minst 85 deltagare för att ha en 80 % chans att hitta statistiskt signifikanta korrelationer med 0.05 som p-värde med en förväntad

korrelationskoefficient på minst 0.30.