• No results found

Det här avsnittet handlar om studiens metoder och analyser. I avsnitt 5.1. redogörs för hur alla relevanta förekomster av fenomenet nominativt en samlats in och analyserats. I avsnitt 5.2.

presenteras metoderna för insamlingen av referensmaterial och hur detta används i frekvensanalyser och jämförelser med nominativt en. I avsnitt 5.3. gås de olika texttyperna igenom och den komparativa analys de ligger till grund för. Sist, i avsnitt 5.5., diskuteras de etiska överväganden denna studie gett upphov till. När det generiska pronomenet refereras till, oavsett ytform, skrivs det i versaler: MAN.

5.1. Materialinsamling, relevansanalys

I den här studien är alla förekomster av nominativt en, vilket är ett generiskt pronomen som fungerar som subjekt i satsen. I svenskans raka ordföljd åtföljs subjektet oftast av ett verb i predikatet, som i exempel 20.

20. Inte världens bästa frissa, men en gör så gott en kan! (BM.2010.33)

Ytformen en kan också fungera som indefinit artikel och räkneord, vilka ofta är prepositionerade substantiv men inte alltid, de kan också stå ensamma med ett utelämnat huvudord som i exempel 21 och 22.

21. En och en gick de in och visade kläder (REF.01)

I exempel 22 kan första satsen, en vill leka, analyseras som ett exempel av ett nominativt en, men tack vare kontexten ges möjligheten att istället analysera en som räkneord.

22. En vill leka, en vill gosa och den tredje vill ingenting (REF.02)

I den utvalda korpusen bloggmix förekommer ordet en ungefär en miljon gånger under året 2012. För att hitta så många fall som möjligt av en som nominativt generiskt pronomen, och utesluta så många fall av en som indefinit artikel och räkneord som möjligt, har jag begränsat mig till att bara söka efter en där det åtföljs av ett verb. En är placerat före verbet i över fyra tusen fall av de dryga miljonen förekomsterna. Nästa steg är att försöka använda den automatiska ordtaggningen som finns i Språkbanken Korp och välja ytformen en i ordklassen pronomen och med lemgrammet (grundformen) man. Sökningen blir då begränsad till cirka femtonhundra träffar, varav 162 visar sig

17

vara just det generiska pronomenet en i nominativ position efter en manuell genomgång och grammatisk analys av underlaget. Den fullständiga söksträngen i Språkbanken Korp är då:

[word = "en" & pos = "PN" & lex contains "man\.\.pn\.1"] [pos = "VB"]

Det finns också andra typer av satser att söka i; när ett annat element står i fundamentet (t.ex. ett temporalt adverb) och subjektet hamnar efter verbet, eller när en åtföljs av en negation eller föregås av ett verb i en bisats. Eftersom en normalt är en ackusativform, blir dessa sökningar mycket tidskrävande och varje enskild förekomst en tidskrävande analys. Därför har jag i dagsläget bortsett från dem.

En av de viktigaste analysstegen är att avgöra ifall en post är skriven på dialekt. I de fall där det finns tydliga talspråksmarkörer, eller andra ord som är dialektala i kontexten, så utesluts de träffarna (se exempel 23). Även om det finns risk för viss godtycklighet så är undersökningen ämnad att hitta fall där skribenten medvetet använder sig av nominativt en på ett normkritiskt sätt, och därför är inte de dialektala träffarna relevanta. De utgör mindre än en promille av alla förekomster av nominativt en.

23. ujuj, ja möe ska en se innan öge triller av (REF.03)

En svårighet med materialet är att det är automatiskt taggat från oredigerade källor, därför gör stavfel att taggningen inte fungerar som det ska alltid. Exempel inkluderar särskrivning av envar, en där det borde vara den eller sen, och substantiv som felstavats så att de tolkas som verb varpå det prepositionerade en analyseras som pronomen istället för indefinit artikel eller räkneord.

En ytterligare svårighet är inkorrekta meningar, dvs. meningar som inte följer de svenska skriftspråkliga konventionerna och därför blir svåra att förstå och analysera. I vissa fall handlar det om rena stavfel som gör att meningar dyker upp i sökningen. I exempel 24 har författaren en tog istället för en tok, där annoteringen tolkat tog som ett verb trots att det är en felstavning. Det ignoreras i materialinsamlingen. Även i exempel 25, tolkas meningen som en felskrivning, där om bör vara som, men eftersom en är utbytbart mot man i det fallet så tas den, och liknande meningar, med i materialinsamlingen.

24. Jag letar som en tog efter ett par skor (REF.04)

25. Jag känner inget i alla fall .. peppar peppar om en säger.. (BM.2011.32)

18

I vissa fall förekommer dubbeltydighet i materialet. Om en av tolkningarna är att en är utbytbart mot man så är förekomsten giltig och medtagen i materialet. I exempel 26 är det möjligt att tolka meningen som vänskap dör när [den ena av två vänner] slutar ta initiativ alternativt Vänskap dör när [man, med referens till skribenten själv] slutar ta initiativ.

26. Vänskap dör när en slutar ta initiativ (BM.2009.62)

Metaspråklig användning av det generiska pronomenet tas inte med. I exempel 27 räknas de två första en, men inte det tredje eftersom det är metaspråkligt, dvs. att skribenten skriver om användningen, snarare än använder uttrycket i löpande text.

27. Om en vill vara könsneutral kan en använda pronomenet en. (FL.2017.24)

Varje enskild förekomst av nominativt en räknas, även om de förekommer i en och samma mening, som i exempel 28, där det är en mening som innehåller tre förekomster av nominativt en (och en förekomst av en som indefinit artikel som bortses ifrån).

28. Inte bara arbetsförhållanden utan allt som har med textilindustrin att göra, det finns bra alternativ och jag förstår, jag gör verkligen det, att en anser att en inte har råd att köpa en klänning för 1500 om en kan köpa tre för samma pris på H&M. (BM.2012.58)

Förekomsterna av en är manuellt insamlade och analyserade i flera omgångar, varför 99.7%

konfidensintervall3 används. Resultaten presenteras dels med respektive datapunkter och dels med en trendlinje med ett trepunkters rullande medelvärde, samt i grafer som visar felmarginalerna.

5.2 Frekvensanalys

Som referensmaterial har jag tagit fram samtliga förekomster av pronomenet man i nominativ form, enligt identiska förutsättningar som sökningen efter en, se nedan:

3 Ett konfidensintervall på 99,7% innebär att sannolikheten att de presenterade resultaten inte beror på slumpen är 99,7%.

19

[word = "man" & pos = "PN" & lex contains "man\.\.pn\.1"] [pos = "VB"]4

Det innebär att förekomsterna av normkritiskt en ställs i relation till dels förekomsterna av man, och dels till det totala antalet generiska pronomen i nominativ position under ett specifikt år, både som delar av och dess relativa förändring. Eftersom materialstorleken varierar mellan åren så normaliserar jag värdet till x per en miljon token. I presentationen av resultatet används ett 99,7%

konfidensintervall. För att jämföra hur mycket en och man förändras över tid normeras de mot 2007, det vill säga mitten av intervallet.

5.3 Komparativ analys av texttyper

På grund av de utvalda korpusarnas storlek, mellan 81 och 505 miljoner token, blir det ett stort antal sökträffar med strängen [word = "en" & pos = "PN" & lex contains "en\.\.pn\.1"] [pos = "VB"]. Som exempel kan nämnas att i Twitter-korpusen resulterar söksträngen i närmare trettio tusen sökträffar.

Därför utgörs den här delen av studien av stickprov bland de 1000 första sökträffarna i vardera korpus.

Därefter görs en extrapolering till resten av materialet. Resultaten presenteras med ett 99,9%

konfidensintervall.

5.4. Grammatisk analys

När det gäller den grammatiska analysen så utgår kategoriseringen ifrån Skärlund (2017:59). För en mer fullständig genomgång av respektive kategori, se 3.1.2 Grammatiska funktioner . Utöver de kategorier som Skärlund (2017) använder sig av undersöks här även numerus, eftersom man kan användas i både singular och plural, men en endast i singular och endast i referens till skribenten själv enligt Hultman (2003, s. 93). Det är därför av intresse att undersöka huruvida begränsningen till singular ärvs av ackusativt en när en används i nominativ, eller om nominativt en har samma användningsområden som nominativt man. Det vill säga, är det den grammatiska funktionen eller ytformen som bestämmer hur en kan användas? De utökade kategorierna återfinns i sin helhet i Tabell 4, nedan.

4 För en fullständig översikt över sökningar med hjälp av CQP-frågor i Språkbanken Korp, se http://cwb.sourceforge.net/files/CQP_Tutorial.pdf (Evert & The CWB Development Team, 2020)

20

Tabell 4 Grammatiska kategorier för det generiska pronomenet man

Grupp Funktion Förklaring Specificitet Definithet Numerus 1 Generiskt syftar på alla människor Ospecifik Indefinit Plural 2 Icke-specifikt

indefinit

syftar på en tänkt grupp Ospecifik Indefinit Plural

3a Specifikt indefinit syftar på en för den tilltalade okänd person som verkligen existerar

Specifik Indefinit Singular

3b Specifikt indefinit syftar på en för den tilltalade okänd grupp av personer som verkligen existerar

Specifik Indefinit Plural

4a Definit syftar på en för den tilltalade känd person som verkligen existerar (inkl. talaren själv)

Specifik Definit Singular

4b Definit syftar på en för den tilltalade känd grupp av personer som verkligen existerar

Specifik Definit Plural

I den här delen av studien görs ett urval i de förekomster som hittats, med syftet att hitta olika typer av användningsområden, enligt Tabell 4. Förekomsterna i korpusen har relativt liten kontext, dvs.

endast den mening som en förekommer i, är det svårt att uttala sig om en eventuell anaforisk användning av pronomenet som syftar till en referent som är tidigare uttalad. Därför blir osäkerhetsfaktorerna för stora för att kunna göra en statistisk analys av hela materialet.

5.5. Etiska överväganden

Det grundläggande kravet för skydd av individer, i enlighet med de forskningsetiska principer som Vetenskapsrådet (2002) tagit fram, kan delas upp i fyra delar. Dessa är informationskravet, samtyckeskravet, konfidentialitetskravet och nyttjandekravet. Det innebär att deltagare i studier har rätt till information om vad studien handlar om, att de ska få lämna samtycke och har rätt att dra tillbaka detta, att personuppgifter ska behandlas konfidentiellt och att informationen inte får användas i kommersiellt eller icke-vetenskapligt syfte.

21

Språkbanken är en offentlig resurs som följer de forskningsetiska principerna, så i korpusarna finns inga personuppgifter. De flesta korpusar som använts till den här studien är meningsomkastade för att ytterligare minimera riskerna för enskilda skribenter, förutom Wikipedia som inte har en enskild skribent utan är gemensamt författad av många olika användare. Det är trots detta teoretiskt möjligt att identifiera enskilda individer som skrivit enskilda meningar i korpusarna, varför ingen information om vilka enskilda bloggar en mening kommer ifrån har samlats in i den här studien. Dessutom har jag i materialet kontrollerat så inga fullständiga namn, användarnamn eller länkar till andra webbsidor finns med, varvid man ytterligare minimerar riskerna att kunna identifiera en enskild individ.

22

Related documents