• No results found

Delstudiernas övergripande upplägg

In document Judy Ribeck Steg för steg (Page 92-99)

De lärobokstexter som ingår i undersökningarna delas upp utifrån två grund-läggande dimensioner – ämne och stadium. Dessutom grupperas läroböcker i ämnena biologi, fysik och kemi under ämnesfacksbeteckningen ”naturveten-skap” och läroböcker i geografi, historia och samhällskunskap under

ämnes-26I sällsynta fall inträffar det att en variabel förekommer i den ena korpusen i jämförelsen men inte i den andra. Därför tillämpas ett slags utjämningsteknik genom vilken sådana frekven-ser uppskattas (jfr smoothing i t.ex. Jurafsky och Martin 2009).

27De tekniska parametrarna i den automatiska extraktionsmodellen har bestämts på heu-ristisk väg. I arbetet med att ta fram en ordlista över svensk akademisk vokabulär (se 2.2.4) testades kombinationer av alla krav som tidigare använts för att extrahera akademiska ord. De resulterande listorna utvärderades sedan manuellt utifrån vår intuition om ords användning och stilvärde. De slutliga kriterierna och tröskelvärdena är de med vilka vi erhöll bäst precision enligt denna kvalitativa bedömning.

facksbeteckningen ”samhällsvetenskap” (jfr kunskapsfamiljer i Selander 2001: 127). Ämnesfackstilldelningen grundar sig på några homogenitetstester som utfördes på en delmängd av läroboksmaterialet i ett tidigt stadium i avhand-lingsarbetet. I dessa tester fann jag ingen grund för att gruppera NO-ämnena tillsammans med matematik, vilket man ibland har gjort i tidigare forskning (t.ex. i OrdiL-projektet). Mina matematiktexter platsar inte i någon övergri-pande ämnesfacksgruppering och behandlas därför som ett separat ämnesfack. Genom att betrakta läroböcker i ett visst ämnesfack eller ett visst ämne som olika register, blir det möjligt att jämföra dels olika ämnesfackliga språk, dels olika ämnesspråk, med varandra.

Resultaten av delstudierna redovisas i var sitt kapitel. Vidare utförs analys-erna på olika sätt för mått med rent kvantitativa resultat och för de variabler på vilka indexprincipen appliceras. Också resultatredovisningen skiljer sig för dessa olika slags undersökningar.

För kvantitativa mått som t.ex. LIX och nominalfrastäthet, genomförs ana-lyserna på följande vis: i ett första steg undersöks ämnesfacken (naturveten-skap, matematik och samhällsvetenskap). I samma steg undersöks även samt-liga läroböcker under kategorin ”hela läroboksmaterialet”. I nästa steg de-las naturvetenskap och samhällsvetenskap upp i sina ämnesmässiga bestånds-delar. Samtliga dessa analyser genomförs separat för högstadie- respektive gymnasietexterna.

Resultaten för de kvantitativa måtten redovisas i första hand i form av linje-diagram över medelvärden. För läroboksmaterialet i dessa linje-diagram finns två diskreta mätpunkter, en för högstadietexter och en för gymnasietexter. Dessa två mätvärden binds sedan samman med linjär interpolation, för att visa på utvecklingen i stadieövergången mellan högstadiet och gymnasiet.

I linjediagrammen ingår även värden för referenskorpusarna med akade-miska och berättande texter. Dessa korpusar delas inte upp i sina beståndsdelar och får därför bara ett värde var. Anledningen till att de berättande texterna in-te delas upp i barnböcker, ungdomsromaner och vuxenromaner är att storleks-skillnaderna mellan korpusarna har bedömts vara för stora. Närmare bestämt är barn- och ungdomskorpusarna för små för att redovisas separat (jfr avsnitt 3.3).

I vissa fall kompletteras linjedragrammen med låddiagram, för att bätt-re åskådliggöra fördelningen av variabelvärden. Resultaten av de kvantitati-va måtten redovisas också genomgående i tabellformat i appendix, där även medianvärden och standaravvikelser anges.

I delstudierna av ord, nominalfraser och meningar används indexprincipen för att extrahera språkliga variabler som är typiska för ämnesspråken. I den-na process produceras indexlistor för samtliga för avhandlingen kritiska äm-nen/ämnesfack och stadier. Analysgången för de variabler som studeras utifrån

indexprincipen är tredelad och illustreras därför av tre olika figurer, 14–16. I dessa står de dubbla pilarna för de jämförelser som görs i varje steg. Varje sådan jämförelse resulterar i två indexlistor. I det första steget (se figur 14) jämförs naturvetenskap som ämnesfack med de andra ämnesfacken, matema-tik och samhällsvetenskap, stadium för stadium.

I det andra steget (se figur 15) delas naturvetenskap upp i sina ämnesmäs-siga beståndsdelar. Här jämförs sedan varje ämne på högstadiet med samma ämne på gymnasiet för att urskilja stadietypiska ämnesspråkliga variabler.

Figur 15: Steg 2 i analysgången för variabler som studeras utifrån indexprincipen

I det tredje och avslutande steget (se figur 16) jämförs naturvetenskap som ämnesfack med referensmaterialen. I dessa jämförelser innehåller naturveten-skapskorpusen såväl högstadie- som gymnasietexterna. Det finns flera anled-ningar till att jag valt att inte inkludera någon stadieaspekt i detta steg. För det första är referensmaterialen, som bekant, inte nivåuppdelade (motsvarande högstadiet och gymnasiet). Vidare framkom i förberedande tester att mycket små skillnader märks i indexlistorna, om dessa tas fram separat för högstadi-et och gymnasihögstadi-et; på sin höjd byter några konstruktioner plats med varandra i stadieövergången. Slutligen undersöks skillnaden mellan naturvetenskap på högstadiet och gymnasiet ändå tillräckligt väl i steg ett och två i analysgången. I delstudierna framkommer ibland resultat som föranleder ytterligare eller mer djupgående undersökningar av någon aspekt. Några sådana utvikningar har också genomförts och jag kallar dem för fokusstudier (se t.ex. 7.2.2). Re-sultaten av fokusstudierna redovisas alldeles före den sammanfattande diskus-sionen för delstudien i fråga.

6 DELSTUDIE: TRADITIONELLA TEXTANALYSMÅTT

Delstudien av traditionella textanalysmått består av två avsnitt. Det första be-handlar följande vanliga ytliga textanalysmått: meningslängd, ordlängd, läs-barhetsindex och ordvariationsindex. Därefter följer beräkningar av några litet djupare textanalysmått, som i viss utsträckning nyttjar lingvistisk information: ordklassfördelning, nominalkvot och lemmavariationsindex.

För samtliga dessa variabler presenteras grafiska översikter över mätresul-taten i det följande. I figurerna har referenslinjer för de berättande respektive akademiska texterna infogats som fasta mätpunkter att förhålla värdena för lärobokstexterna till. Dessutom återfinns alla exakta mätvärden i appendix E.

6.1 Ytliga textanalysmått: presentation 6.1.1 Meningslängd

Enligt Hellspong och Ledin (1997: 75) är en beräkning av texters genomsnitt-liga meningslängd i antal ord ett sätt att ”ta ett allmänt grepp om syntaxen” och ”överblicka meningarna”. Anledningen till att meningslängden är intres-sant är att långa meningar ofta medför en hög syntaktisk komplexitet, eftersom sådana oftare har en invecklad, hypotaktisk struktur med bisatser av olika un-derordningsgrad (Platzack 1973: 111). Men denna korrelation är inte entydig. Exempelvis hävdar Hellspong och Ledin (1997) att långa meningar i texter med nominal stil beror på långa nominalfraser och samordningar, medan långa meningar i texter med verbal stil i stället orsakas av långa prepositionsadver-bial och många underordnade satser. Också antagandet att korta satser skulle vara mer lättlästa har ifrågasätts, då studier har visat att korta texter och satser ofta utgör hinder för läsförståelsen och är symptomatiska för bristande logisk uppbyggnad av innehållet (jfr Hvenekilde 1993; Reichenberg och Lundberg 2011).

Några exempel på läroboksstudier som innehåller beräkningar av menings-längd är: Westman 1974; Danielsson 1975; Melin 1995; Sandqvist 1995; Ekvall 1997.

6.1.2 Ordlängd

Ordlängdär också ett mått som kan användas för att uppskatta texter svårig-hetsgrad. Texter med fler längre ord anses vara mer lexikalt komplexa att pro-cessa. Detta har att göra med att långa ord, som i svenskan ofta bildas genom sammansättning eller avledning, ofta är ovanliga, svåra och innehållsrika, me-dan korta ord ofta är vanliga, enkla och mer allmänna (Hultman och Westman 1977).

6.1.3 Läsbarhetsindex, LIX

Läsbarhetsindex, LIX, är ett mått för att snabbt uppskatta hur lättläst en text är. Måttet skapades av Björnsson (1968) och används fortfarande flitigt (La-gerholm 2008), även om det ofta har blivit kritiserat under årens lopp (se t.ex. Lundberg och Reichenberg 2008).28

LIX beräknas enligt (57), där ”långa textord” innehåller fler än sex bokstä-ver.29Värdet på denna gräns beror på att frekvensen av ord med sju eller fler bokstäver har visat ett direkt samband med stigande upplevd svårighetsgrad hos texten. För ord med sex bokstäver eller mindre är tendensen den motsatta; ju fler korta textord, desto enklare upplevs texten (Thelander 1970: 31).

LIX= textord

meningar+ 100 ×

långa textord

textord (57)

LIX har ofta använts i undersökningar av lärobokstexter (se t.ex. Danielsson 1975 och Melin 1995). Björnsson (1968) rapporterar att LIX för läroböcker för årskurs två är 22, för årskurs fem 31 och för årskurs åtta 37. Härutöver anges barn- och ungdomsböcker ha ett LIX på 27, skönlitteratur för vuxna 33,

28Några moderna exempel på avhandlingar som metodologiskt baseras på LIX är Partanen 2006 och Kuisma 2013. Härutöver finns en uppsjö av studentuppsatser som använder måttet för att bedöma texters svårighetsgrad (se t.ex. Bergstrand Grenner och Ekblad 2011; Kiland 2012; Fagerström och Karlsson 2014).

saklitteratur 47 och facklitteratur 56. Melander (2003) nämner också att andra läroboksstudier som beräknat LIX har uppmätt värden mellan 41 och 45 för högstadieböcker och mellan 47 och 50 för gymnasieböcker.

6.1.4 Ordvariationsindex, OVIX

Ordvariationsindex, OVIX, är ett mått på hur varierat ordförrådet i texter är.30 Måttet är utvecklat av Hultman och Westman (1977) och beräknas enligt (58):

OV IX= log(textord)

log(2 −log(textordstyper)log(textord) ) (58)

Melin (1995) och Sandqvist (1995) använder OVIX-måttet i sina läroboks-undersökningar. Ett högt OVIX-värde har tidigare visat sig korrelera med dels goda elevtexter, dels höga betyg (Hultman och Westman 1977; Johansson Kok-kinakis och Magnusson 2009; Nordenfors 2011).

6.2 Djupare textanalysmått: presentation

In document Judy Ribeck Steg för steg (Page 92-99)