• No results found

Avhandlingens delstudier

In document Judy Ribeck Steg för steg (Page 87-90)

Avhandlingen innehåller fyra olika delstudier, vilka, i tur och ordning, be-nämns: traditionella textanalysmått, typiskt ordförråd, typiska nominalfraser och typiska meningar. Inom varje delstudie analyseras vidare en eller flera olika mätbara egenskaper. De fyra delstudierna och samtliga variabler som un-dersöks listas i tabell 5.1.

Delstudie Variabel Traditionella textanalysmått lemmavariation läsbarhetsindex meningslängd nominalkvot ordklassfördelning ordlängd ordvariation

Typiskt ordförråd ord

Typiska nominalfraser

nominalfraslängd nominalfrastäthet nominalfrasuppbyggnad

Typiska meningar meningsuppbyggnad parsningsdjup

Tabell 5.1: De variabler som undersöks i avhandlingens fyra olika delstudier

Valet av delstudier och variabler har påverkats av flera olika faktorer. En ut-gångspunkt har varit att undersöka ämnesspråkliga drag i ett så brett perspektiv som möjligt och att påvisa fördelar med språkteknologisk textanalys på flera olika språkliga nivåer. Samtidigt har jag naturligtvis velat studera sådana vari-abler som är meningsfulla att beskriva utifrån syftet med undersökningen. Den hypotes som framförs i inledningskapitlet, att texters utformning påverkar

för-ståelsen för dem, föranleder delstudier som på något sätt indikerar olika grader av språklig svårighet eller komplexitet. En annan grundläggande förutsättning har varit att språkdragen ska kunna kvantifieras och analyseras automatiskt.

Än så länge är språkteknologiska analyser i stort sett begränsade till kon-struktioner som bygger upp meningar. Språkliga medel för att skapa samman-hang i text (koherens och kohesion), som har en central roll inom textlingvisti-ken, kan t.ex. knappast mätas automatiskt. Jag har också bedömt att material-underlaget är alltför litet för att försöka identifiera olika typer av flerordsut-tryck.24

Olika slags ytliga textanalysmått (jfr Heimann Mühlenbock 2013), som ordlängd och meningslängd, har sedan 1960-talet använts inom den kvanti-tativa stilistiken och läsbarhetsforskningen (jfr Svensson och Karlsson 2012) för att komma åt lingvistiska drag och språklig komplexitet. Flera av studier-na inom denstudier-na tradition har pekat mot intressanta resultat. Denstudier-na avhandlings första delstudie kan ses som en replik på denna tidigare textforskning, med start på 1960-talet. Den främsta anledningen till att inkludera dessa traditionel-la kvantitativa textanalysmått är att möjliggöra enktraditionel-la jämförelser meltraditionel-lan mina resultat och andras. Valet av variabler i denna delstudie är också influerat av de parametrar som Heimann Mühlenbock (2013) finner värdefulla för bedömning av texters svårighetsgrad.

Med de efterföljande delstudierna går jag bortom tidigare kvantitativa stu-dier, i vilka indikatorer på språkliga drag kartläggs, genom att i stället mäta oli-ka språkdrag direkt. Dessa delstudier har konstruerats för att undersöoli-ka några viktiga aspekter på språklig uppbyggnad i texterna – ordförråd, informations-packning och strukturell komplexitet. Gemensamt för dessa delstudier är att resultatredovisningarna bygger på s.k. indexlistor (se vidare avsnitt 5.3 i detta kapitel).

Delstudie nummer två berör lärobokstexternas ordförråd. Denna studie är till viss del en vidareutveckling av tidigare forskning om framtagning av olika slags ordlistor, som frekvenslistorna i OrdiL-projektet och de akademiska ord-listor som utvecklats för engelska och svenska (se avsnitt 2.2.3 och 2.2.4). Att skapa förteckningar över typiska ord i textsamlingar är ett sätt att innehålls-mässigt beskriva texttyper. Appliceras metoden på lärobokstexter från olika ämnen och stadier kan såväl ämnestypiska som stadietypiska ord extraheras. I den andra delstudien redovisas indexlistor över typisk ämnesspråklig vokabu-lär, som tagits fram enligt metoder som utnyttjar både lingvistisk och statistisk information.

24Under arbetets gång har jag dock testat att automatiskt identifiera flerordsuttryck i delar av mitt läroboksmaterial (se Ribeck 2011; Ribeck och Borin 2014).

Delstudierna tre och fyra syftar till att mäta olika aspekter av språklig kom-plexitet. För att processa en mening måste man kognitivt greppa relationerna mellan meningens olika ord. Hur lätt eller svårt det är att upprätta denna menta-la modell är svårt att bedöma med sådana textanalysmått som dominerade den tidiga läsbarhetsforskningen. Långa meningar kan t.ex. orsakas av syntaktiska konstruktioner med mycket olika svårighetsgrad.

På senare tid har emellertid mer sofistikerade textanalysmått utvecklats för att mäta meningars komplexitet direkt och därmed mer korrekt (jfr Lin 1996). De vanligaste sådana läsbarhetsmått är: genomsnittligt antal nominal- eller verbfraser per mening, genomsnittligt antal bisatser per mening och genom-snittligt parsningsdjup (Schwarm och Ostendorf 2005; Collins 2014). För att beräkna dylika värden automatiskt, med språkteknologiska metoder, behöver orden i en mening stå i beroendeförhållanden till varandra, vilket de t.ex. gör i en dependensgrammatisk analys (se Mel’ˇcuk 1988).

Förutom att ”svårt” språk ofta är strukturellt komplext och påfrestar kort-tidsminnet genom att anstränga vår parsingskapacitet, är det också ofta inne-hållspackat och kräver mentalt processande av stora propositionsmängder på kort tid (jfr Melin 2007). Dessa två aspekter på svårt språk, innehållspackning och strukturell komplexitet, undersöks i de två avslutande delstudierna.

I tidigare studier har man funnit att långa meningar i läroböcker främst orsakas av långa nominalfraser (jfr avsnitt 2.4.2.1). I delstudie nummer tre studeras just nominalfraser, i syfte att mäta informationspackning på bättre sätt än med t.ex. nominalkvot. Dessutom borde indexlistor över typisk nominal-frasuppbyggnad kunna ge en tydligare bild av komplexiteten i nominalfraser.

Den avslutande delstudien, nummer fyra, handlar om typiska meningar. I delstudien mäts strukturell komplexitet, genom att undersöka meningars maxi-mala parsningsdjup, en strategi som baseras på antagandet att kortare depen-denskedjor är lättare att processa än längre (jfr Mel’ˇcuk 1988). Dessutom be-skrivs komplexiteten med hjälp av indexlistor över typisk meningsuppbygg-nad.

Dessa avslutande delstudier, av nominalfraser och meningar, är något mer explorativa till sin natur än de inledande delstudierna. Möjligheterna att studera syntaktiska konstruktioner i större material har tidigare varit begränsade. Det finns därför inte riktigt någon tradition att ansluta sig till. Av den anledningen var det inte alldeles självklart att det skulle fungera att applicera indexprincipen på flerordiga variabler. Metoden utvecklades nämligen ursprungligen för att identifiera texttypiska ord, men har i och med detta avhandlingsarbete justerats på några punkter efter arbetets teoretiska förståelse och materialunderlag (se vidare avsnitt 5.3 i detta kapitel).

In document Judy Ribeck Steg för steg (Page 87-90)