• No results found

6. Delstudie I: Användningen av LSL

6.1 Loggfiler av typ a: Lexikonuppslagningar

6.1.2 Korrigerade uppslagningar 2008 och 2011

6.1.2.2 Korrigering med förslag

Den andra typen av korrigering är korrigering med förslag. I tabell 6:9 och 6:10 listas de 25 vanligaste uppslagningarna av detta slag i respektive material. Där anges också antalet ordförslag som korrigeringen genererar samt exempel på föreslagna uppslagsord.

Tabell 6:9. De 25 vanligaste uppslagningarna som leder till korrigering med förslag

2008.

2008

Plats Antal Söksträng Utfall Förslag

1 88 empati 3 apati, ympat, sympati

2 36 gamla 5

3 35 cv 8 ev, av, tv, ca, co, cl, cm, cp 4 35 gammla 16

5 30 präglas 3 prägla, präglad, präglat

6 26 engagerad 4 engagera, engagerat, engagerar, engagerade 7 26 sarkasm 2 parkas, barkass

8 24 neger 2 seger, niger 9 21 autonomi 3

10 19 definiera 2

11 19 pedant 15 dant, pant, plant, pekat, pedal, nedan, ledan, medan 12 18 håglös 3

13 17 anal 6 ana, anar, banal, kanal, antal, anal-14 17 fingerad 4 fingera, fingerat, fingerar, fingerade 15 17 livegna 3 liven, literna, livlina

16 17 vasall 7 svall, vall, nasal, nasal-, nasala, avfall, avkall 17 16 donator 7

18 16 epitet 15 pietet, pitt, bitet, nitet, litet, vitet, piket, opiet, slitet 19 16 karma 11 krama, arma, karm, larma, varma, kamma, karga 20 16 sverige 2 Sverige,

sverige-21 16 åäö 72 -ö, dö, mö, kö, hö, tö, än, ät 22 15 dement 2 gement, cement

23 15 dynamik 2 dynamit, dynamisk 24 15 järv 5 jäv, kärv, värv, järn, djärv 25 15 milis 18

Vad gäller ordförslag som ges kan vi för uppslagningarna 2008 inte alltid få helt tillförlitliga uppgifter om vilka konkreta ord som presenteras eftersom LSL3 inte längre finns tillgänglig. Därför saknar tabell 6:9 ordförslag för vissa uppslagningar. Genom att slå upp orden i något av de tvåspråkiga lexikonen – som ju ännu inte uppdaterats – kan man emellertid se vilka svenska ordförslag som då ges. De motsvarar delvis de förslag som gavs vid en sökning i 2008 års version av LSL. Något som dock måste beaktas är att rättstavningshjälpen har förbättrats sedan 2008 och fungerar på alla Lexin-lexikonen – uppdaterade eller inte. Detta kan alltså påverka vilka förslag som ges. Ordförslagen anges vidare i den ordning de presenteras i LSL. Om förslagen är många anges så många som utrymmet i tabellen tillåter.

Samtliga söksträngar förutom åäö i tabell 6:9 utgör identifierbara svenska ord. Alla ord utom ett, gammla (plats 4), är dessutom rättstavade. Söksträngarna utgörs av grundformen i 20 fall av 25. Även här tillhör många av orden ett mer avancerat ordförråd än vad som kan förväntas av en nybörjarinlärare i svenska. Exempel på sådana substantiv är empati (1), sarkasm (7), autonomi (9) och

vasall (16). Bland adjektiven finner vi t.ex. håglös (12) och dement (22). Bland

de få verben är fingerad (14) ett lämpligt exempel.

I LSL4, dvs. LSL av idag, leder 14 av de aktuella söksträngarna till träff, där-ibland empati, håglös och dement. En av söksträngarna, milis (25), automat-korrigeras numera olyckligtvis till uppslagsordet mil. Övriga 10 söksträngar utgörs följaktligen fortfarande av lemmaluckor, t.ex. sarkasm (7), pedant (11),

epitet (18), karma (19) och järv (24). När det gäller ordformer som sarkasm och pedant kunde mycket lämpliga ordförslag ha varit de befintliga lemmana sar-kastisk och pedantisk, istället för de givna förslagen parkas och barkass respektive dant, pant och plant m.fl. Vi återkommer till rättstavningshjälpens

funktiona-litet längre fram.

Uppslagningarna från 2011 som leder till korrigering med förslag presen-teras i tabell 6:10. Söksträngarna 2011 utgör till att börja med en mer blandad ordsamling än de från 2008. Utländska ord varvas med oidentifierbara sök-strängar och mer svårbedömda felstavningar av förmodade svenska ord. De rättstavade svenska orden är 10 stycken, t.ex. generera (5), hejdå (11), löpande (20) och heroisk (21). De felstavade svenska orden verkar vara 7 till antalet, såsom kanalle (6), tyvär (16) och sveder (17). De utländska söksträngarna upp-skattas till 5 stycken, exempelvis cat (2), tikanis (4) och hog (24). Söksträngen

tikanis tolkas här som den grekiska frasen ti kanis med den ungefärliga

bety-delsen ’Hur mår du?’. Till sist har vi 3 stycken enstaviga söksträngar, za (10), ze (15) och zi (22) som är mer svåridentifierade. Det är tänkbart att de två först-nämnda strängarna är polska ord som betyder ’för, istället för’ respektive ’från’.

Tabell 6:10. De 25 vanligaste uppslagningarna som leder till korrigering med förslag

2011.

2011

Plats Antal Söksträng Utfall Förslag

1 36 lexin 31 exen, exil, lin, lien, len, kemin, kexen, taxin 2 34 cat 6 at, ca, fat, lat, mat, hat

3 31 härdigt 5 färdigt, värdigt, händigt, härligt, ihärdigt 4 29 tikanis 6 tians, tikars, fikans, tikens, bikinis, tikarnas 5 25 generera 13 genera, genrer, genrers, generna, generar 6 24 kanalle 15 nalle, kalle, knall, knall-, knalla, knalls, kanal 7 23 bevar 8 vevar, revar, bovar, bävar, benar, betar, bevara 8 22 hi 13 bi, ni, vi, si, hd, ha, ho, hs, hr, hö, hy, hiv, hit 9 22 fafarr 10 farfar, fasar, faxar, katarr, safari, faxars, fanfar 10 19 za 8 ca, la, ja, ha, va, ta, sa, zs

11 19 hejdå 2 hejd, hejda

12 18 leventet 3 leendet, adventet, elementet

13 18 fate 12 fat, gate, late, sate, fete, fat-, fatt, fats, flate 14 18 bräserad 10 raserad, baserad, brisera, bogserad, blaserad 15 17 ze 9 fe, ge, de, be, le, ve, te, se, zs

16 17 tyvär 2 tvär, tyvärr

17 17 sveder 5 seder, smeder, svider, sveper, -sveder 18 17 haye 6 hage, hade, hane, hale, hake, hare 19 17 fez 7 fe, feg, fen, fel, fem, fet, fes 20 16 löpande 2 lönande, -löpande

21 16 heroisk 8 heroin, serbisk, persisk, hednisk, hektisk 22 15 zi 5 bi, ni, vi, si, zs

23 15 sverige 2 Sverige,

sverige-24 15 hog 15 ho, fog, dog, bog, nog, log, tog 25 14 zo 13 Co, go, do, bo, lo, jo, ko, ho, ro, po

När det gäller antalet ordförslag som ges varierar detta stort i båda materialen. I de flesta fall är de färre än tio. Två undantag är söksträngen åäö (21) i tabell 6:9 som ger hela 72 ordförslag och (lustigt nog) lexin (1) i tabell 6:10 som ger 31 förslag. Vid första anblicken är kanske inte antalet ordförslag så besvä-rande. I tabell 6:9 genereras relevanta ordförslag vid uppslagningarna på pas-sivformen präglas (rad 5) och perfekt participformen fingerad (rad 14) i form av böjningsformer av dessa verb. (De angivna böjningsformerna blir som vi redan vet sökbara efter uppdateringen av LSL3 och ger alltså träff i LSL4.) Men när

man tittar närmare på vilka konkreta förslag som presenteras och framför allt i vilken ordning de kommer blir bedömningen en annan. Det visar sig då att edi-teringsavstånd inte är en tillräckligt vass urvalsmetod att basera ordförslagen på. För det första är ordförslagen, utifrån ett semantiskt perspektiv, många gånger väsensskilda från sökordets betydelse, och därmed helt irrelevanta, se t.ex.

ge-nerera (rad 5, 13 förslag) i tabell 6:10 med ordförslag som genera, genrer och generna. Ett annat exempel från samma tabell är bräserad (rad 14, 10 förslag)

som bland annat resulterar i förslagen raserad, baserad och bogserad. För det andra hamnar förslag som är tämligen goda ofta först i slutet av förslagslistan, se t.ex. härdigt (3) i tabell 6:10 där de fem ordförslagen ges i följande ordning:

färdigt, värdigt, händigt, härligt, ihärdigt. I samma tabell finner vi också redan

nämnda lexin (1) där de mest rimliga förslagen, lexika och lexikon, placeras allra sist bland de 31 ordförslagen. Ytterligare två exempel är uppslagningarna bevar (7) och zo (25) i tabell 6:10 där de relevanta ordförslagen, bevara och bevars res-pektive zoo, anges sist resres-pektive näst sist.

Rättstavningshjälpen är som sagt baserad på editeringsavstånd (se avsnitt 3.2.4) och inte på uttal eller utifrån några semantiska kriterier. Att basera rätt-stavningshjälpen endast på editeringsavstånd verkar fungera vid mindre fel-stavningar förutsatt att motsvarande rättstavade ord återfinns i ordboken. Men i de fall det sökta ordet inte ingår i LSL blir utfallet av en korrigering många gånger helt missvisande. Söksträngen rationalitet skulle t.ex. i bästa fall leda användaren till adjektivet rationell istället för substantivet nationalitet, såsom sker här.

SAOL Plus (2007), cd-versionen av SAOL13, är ett exempel på en ordlista som har en rättstavningshjälp baserad på både stavning och uttal (Berg et al. 2008a, jfr Lew & Mitton 2011). Den rättstavningshjälpen är utvecklad av före-taget Oribi AB och har till viss grad också anpassats specifikt för uppslagsorden i SAOL. Söksträngen sjonalisster ger t.ex. som enda förslag uppslagsordet

jour-nalist. I LSL4 leder motsvarande söksträng till en icke-träff. Söksträngen haye

(18) från tabell 6:10 resulterar vidare i 10 ordförslag i SAOL Plus. Bland för-slagen återfinns bland andra hajen, haj och hojen som visar på en uttalsmässig rättstavningskorrektion, att jämföra med de editeringsbaserade ordförslagen i LSL4 vilka är hage, hade, hane, hale, hake och hare. Vidare leder söksträngen zo (25) från tabell 6:10 till de två uppslagsorden zoo och zoo- i SAOL Plus. I LSL4 hamnar zoo näst sist bland de 13 ordförslagen.

SAOL Plus ger inte alltid färre ordförslag än LSL4. Det verkar dock som att rättstavningshjälpen i ordlistan maximalt genererar 10 ordförslag. Förslagen är alltså många gånger vettigare tack vare att rättstavningshjälpen är anpassad efter både editeringsavstånd och uttalsmässig stavning.

När ordförslagen är få är den editeringsbaserade ordningsföljden en mindre allvarlig defekt. Men om användaren möts av ett större antal ordförslag blir det

långt besvärligare och onödigt tidsödande att finna det mest relevanta ordet – i den mån det över huvud taget existerar ett sådant. Att värdera vilka förslag som är relevanta är dessutom en helt annan sak för inlärare än för modersmåls-talare. Inlärare förutsätts följaktligen att på basis av sina begränsade svensk-kunskaper kunna avfärda irrelevanta ordförslag som i sin tur har baserats på editeringsavstånd.

Avslutningsvis kan konstateras att få ordförslag å ena sidan är mer användar-vänligt än många förslag. Å andra sidan är inget av dessa scenarion önskvärt så länge ordförslagen inte är relevanta i relation till den sökta strängen. I sådana fall är det måhända mer lämpligt att låta användaren få veta att sökordet helt enkelt inte finns i ordboken. I annat fall skulle det vara funktionellt att be-gränsa antalet ordförslag som kan ges. Det bör man dock inte göra utan att en uttalsmässig rättstavningskontroll har implementerats. En reduktion av antalet ordförslag skulle nämligen i nuläget innebära att de mest relevanta ordförslagen många gånger uteblir.