• No results found

1. LEKTION 4

Mål

-Befästande av de förvärvade kunskaperna och begreppen från lektion 1–3 via statistisk problemlösning på nya data, i mindre grupper

Aktiviteter

-Datorlaboration i mindre grupper

1.1 Inför datorlaborationen

Det förutsätts att läraren är bekant med dataseten; dels via introduktionen till ele-verna i bilaga 9 men också själva dataseten, vilka alla är tillgängliga via:

https://kau.app.box.com/v/MAGK30EkholmSelling2019, för att säkerställa att lära-ren förstår innehållet eftersom frågor på detta kan komma under laborationen.

Viktigt är också att säkerställa att eleverna har tillgång till R kod för de i lektions-serien tidigare genomgångna momenten; antingen via elevernas egna sparade koder från tidigare lektioner, eller också distribuerar läraren exempelkoden i bilaga 6. Me-ningen är inte att eleverna ska ”uppfinna hjulet” igen – de ska utgå från tidigare kod, eftersom huvudfokus inte är behärskandet av programmering i R utan statistisk ana-lys och tolkning.

Eleverna delas in i mindre grupper – helst två och två – och de fem dataseten i R format samt instruktioner i bilaga 9 delas ut till grupperna; en per grupp, med så jämn fördelning av de fem dataseten som möjligt. I en klass på 25-30 elever kommer följaktligen 5-6 personer analysera samma datamaterial.

Muntlig genomgång av instruktioner till datorlaborationen med utgångspunkt i elevinstruktionerna, bilaga 9:

o Analysera data i R utifrån de begrepp som gåtts igenom. Till er hjälp har ni exempelkod eller egen tidigare sparad kod.

o Spara R koden med analyserna ni kört på data.

o Under lektion 5 ska ni sedan presentera frågeställning, data och ana-lyser inför en grupp klasskamrater genom att köra R koden från da-torlaborationen. Kom ihåg att tolka resultaten!

1.2 Under datorlaborationen

Som tidigare nämnts, är det nödvändigt att läraren har koll på dataseten för att sä-kerställa att hen förstår innehållet, eftersom frågor på detta högst sannolikt kommer under laborationen. En del vanliga frågor brukar vara:

Hur tolkas variablerna och variabelvärdena? Självklart är det svårt att utifrån be-skrivningen i bilaga 9 förstå exakt hur variablerna är mätta, hur data är insamlat och testsituationer konstruerade etc. Det är avsiktligt – det vet vi sällan som konsumen-ter av statistik i dagspress och liknande – och det är ett sätt att få eleverna att an-vända sitt kreativa och kritiska tänkande i hur det kanske kan ha gjorts (det kommer

70

också att diskuteras under lektion 5). Om eleverna inte förstår ett ord, går det natur-ligtvis bra att söka upp det på Internet; vidare är det bra om eleverna kan tolka huruvida låga eller höga värden på en variabel är ”bra” eller ”dåligt”; hjälp dem an-nars med det.

Vad är x och vad är y (förklarande- respektive responsvariabel)? Detta är inte helt självklart och är en bra bas för diskussioner, men för att komma vidare rekommen-deras att utgå från hur frågan är uppbyggd i introduktionen till laborationen (x -> y;

den första variabeln i frågeställningen antas vara x och den andra y).

Varför fungerar inte koden? Varför syns inte resultatet? Varför kan jag inte se data? Denna typ av frågor är mycket vanliga under datorlaborationer. Här hänvisas till tidigare text om generell felsökning i R (se bilaga 1).

Lärarens roll, utöver ovan, är att stimulera gruppdiskussionerna med frågor gällande tolkning av analyser; att beräkningarna kopplas till tolkningar – kom ihåg att det är en viktig komponent för att elevernas presentation av datorlaborationerna, med till-hörande diskussion, ska bli givande.

2. LEKTION 5

Mål

-Befästande av de förvärvade kunskaperna och begreppen från lektion 1–3 genom att pre-sentera samt diskutera tolkningar av resultat av sina egna analyser med klasskamrater som analyserat andra datamaterial

Aktiviteter

-Presentationer och diskussioner av resultat och tolkningar i mindre grupper, med läraren som moderator

-Uppföljning och diskussion i klass

2.1 Format för presentation av datorlaborationer

Efter laborationen, under sista lektionen, är tanken att grupperna ska presentera sina resultat och tolkningar för varandra. Denna presentation och diskussion kan för-stås göras på många olika sätt. Ett förslag är att dela upp elevparen som arbetade med samma datamaterial under laborationen i lektion 4 och bilda 5-6 nya grupper i vilka eleverna, så långt som möjligt, har arbetat med separata dataset, och låta ele-verna i dessa grupper presentera inbördes för varandra. För att spara tid och behålla fokus föreslås att presentationerna i grupperna sker via exekvering den R kod de ar-betat med under laborationen och förklara analyser och tolkningar utifrån den.

Lärarens roll är att stimulera och vid behov moderera gruppdiskussionerna med frå-gor gällande tolkning av analyser – detta är en viktig komponent för att elevernas presentation av datorlaborationerna, med tillhörande diskussion, ska bli givande. I 2.2 visas tips på frågor kopplade till de olika dataseten.

2.2 Tips på frågor och diskussioner kopplade till de olika dataseten

Datasetet ”Milk” baseras på en länge omdebatterad frågeställning, den innehåller också, liksom ”global_warming” (nedan) en outlier (extremvärde). Faktum är att om outliern i Milk tas bort så försvinner sambandet (det beror på att antalet observat-ioner är så litet och outliern så extrem). Som bakgrund kan nämnas att detta är data

71

från en publicerad vetenskaplig artikel (som tyvärr inte längre är tillgänglig), och att den blev kritiserad för att outliern helt förändrade resultaten och tolkningen av sam-bandet och att författarna inte varit tydliga med det.

Datasetet ”mäklardata” innehåller, liksom ”global_warming” (nedan), ett större an-tal observationer (se ovan). Mäklardata innehåller även en orimlig tolkning av inter-cept och en viss indikation på att sambandet inte är linjärt (avmattning för höga tax-eringsvärden, rimligt?).

Datasetet ”Radidiots” baseras på en icke-relevant frågeställning (men upplevdes vara relevant då undersökningen gjordes – en viss koppling kan göras till exempel 1;

skärmtid och depression). Vidare innehåller Radidiots exempel på ett samband som egentligen förklaras av en tredje variabel (likt exempel 2 och 3 i lektionsserien).

Datasetet ”global_warming” baseras på en relevant och debatterad fråga och inne-håller ett större antal observationer, det är alltså svårt att bilda sig en uppfattning av data utan statistisk programvara. Diskuteras kan dock att statistiska analyser inte blir svårare när datasetet är större – de görs och tolkas på samma sätt. Noteras kan att datasetet innehåller en outlier (extremvärde). Man kan diskutera hur denna påver-kar beräkningar och resultat (svaret är att det gör den inte; tar man bort denna servation förändras inte resultaten – det har bland annat att göra med mängden ob-servationer som insamlats).

Datasetet ”alcohol_test” visar en koppling mellan före- och eftervärdena, men vad står det för egentligen? Kanske att om man i grunden har en bra reaktionsförmåga så fortsätter man ha det även efter intag av alkohol – trots att den försämras (enligt resultaten). Det är lite klurigt. Har eleverna noterat om det var någon som fick bättre reaktionsförmåga efter jämfört med före?

2.3 Uppföljning och diskussion i klass

Även här finns många sätt att följa upp frågorna i grupperna samt att runda av lekt-ionsserien. Ett sätt som rekommenderas är att lyssna in diskussionerna i de olika grupperna och koppla nyckelfrågor till en mer allmän nivå som innehåller repetition av begrepp och tolkningar över hela lektionsserien. En annan rekommendation är att återkoppla arbetet i laborationerna till delarna i den statistiska processen (som dis-kuterades i lektion 1); det går till exempel att tillsammans fundera över hur data till dataseten kan ha samlats in och hur variabler definierats, etc.

Det finns även så kallade självtester för statistical literacy som kan göras tillsammans i klass om det finns tid över, till exempel:

http://www.surveygizmo.com/s3/3111402/StatisticalLiteracy.

72

73

Related documents