• No results found

6. Diskussion

6.3 Kommentar till semantisk spegling

Den version av semantisk spegling som presenterats i den här uppsatsen är till stora delar likvärdig med den version som presenterats i metodteoriavsnittet (se kap. 3). De båda tolkningarna skiljer sig dock något åt (se kap. 4) vilket ger upphov till vissa resultatskillnader. Dyviks implementation är mera konsekvent eftersom varje grov betydelse tillhör ett unikt semantiskt fält men samtidigt har den delvis samma problem med betydelseuppdelning och tolkning av särdragsstrukturerna som i den här uppsatsen och kommentarerna gäller därför både semantisk spegling generellt och den version som presenterats i denna uppsats. I den version av semantisk spegling som presenterats i den här uppsatsen finns det en del smärre implementationstekniska missar som

behöver justeras. Resultatet från det här arbetets tolkning av semantisk spegling ger både bra och mindre bra resultat, precis som för Dyvik, och frågan är om det går att förbättra resultaten på ett sätt som inte medför för många speciallösningar eller försämrar de resultat som redan är bra.

6.3.1 Datastrukturer

I kapitel 5 har endast slutprodukten av resultatet utvärderats men det är resultatet av flera datastrukturer med ett inbördes beroende.

Betydelseuppdelning

Den process som i semantisk spegling benämns betydelseuppdelning lever inte riktigt upp till vad den utlovar. Betydelseuppdelningen skiljer framförallt ut homografer med olika ordklasser samt ord vars översättningsmöjligheter är tvetydiga på olika sätt i de båda språken. Ord i de båda språken med delvis samma tvetydigheter resulterar i betydelseuppdelningar som innehåller mer än en betydelse. Semantisk spegling är beroende av överlappande översättningsmöjligheter för att kunna relatera ord till varandra och det innebär att vissa ord inte går att relatera till varandra trots att de uppenbart är relaterade. Ett alternativ när ordboksdata används är att utnyttja de ursprungliga betydelse-uppdelningarna.

Semantiska fält

Implementationen av de semantiska fälten är som tidigare nämnts (avsnitt 4.2.2) den del som skiljer sig mest åt från Dyviks beskrivning (avsnitt 3.3) och som får

konsekvenser för resultatet på det sätt som beskrivits i avsnitt 6.1.1. Men de slutsatser som kan dras angående de semantiska fälten gäller för metoden i stort och inte enbart specifika tolkningar av den.

För semantisk spegling generellt gäller att betydelseuppdelningar som innehåller flera betydelser ger upphov till semantiska fält som innehåller flera betydelser vilket

resulterar i semantiska fält som inte är särskilt semantiskt sammanhängande. Men det viktiga med de semantiska fälten verkar vara som tidigare nämnts (avsnitt 3.3) inte att de är semantiskt sammanhängande utan att de får med alla relaterade ord. Men om orden i de semantiska fälten har en tydlig semantisk relation till varandra så innebär det

att slutresultatet blir bra därför skulle ett sätt att förbättra metoden faktiskt vara att förbättra de semantiska fälten; göra de mera semantiskt enhetliga. För att göra de semantiska fälten mera enhetliga krävs antingen hårdare restriktioner på när två betydelser kan sägas vara i samma semantiska fält, kanske något liknande som Dyvik använder för att utöka första spegeln (avsnitt 3.2.2), eller bättre betydelseuppdelning från början. Om de semantiska fälten inte går att förbättra så måste nästa steg i

processen, nämligen särdragstilldelningen, kunna strukturera de semantiskt spretiga fälten.

Särdragstilldelning, semantiska kategorier och delbetydelser

Särdragstilldelning är tänkt att strukturera de flertydiga betydelserna och de semantiskt spretiga fälten för att generera bra lexikoningångar, men tyvärr klarar den inte alltid detta tillräckligt bra. Bättre grova betydelseuppdelningar och “mer semantiska” fält skulle förbättra särdragsstrukturerna och ge ett bättre resultat. Särdragstilldelningen tilldelar ord med högst mängdfrekvens i de semantiska fälten minst antal särdrag. Eftersom de semantiska fälten ofta innehåller flera betydelser så innebär det också att tvetydiga ord tillsammans med vaga eller allmängiltiga ord har en större sannolikhet att förekomma många gånger och därmed tilldelas minst antal semantiska särdrag trots att dessa kategorier är i störst behov av dem eftersom antalet särdrag begränsar antalet möjliga uppdelningar i delbetydelser. För att komma till rätta med detta skulle särdragstilldelningen kunna “vändas” så att specifika entydiga ord med låg frekvens endast fick ett särdrag medan ord med högre frekvens ärvde från dessa lågfrekventa ord och därmed fick en ökad möjlighet till betydelseuppdelning. Exempelvis skulle

svenskans oklar ärva egenskaper från gyttjig, dimmig, ofärdig, odefinierad och inte tvärtom som sker nu. Sedan skulle oklar maximalt kunna delas upp i dessa fyra specifika betydelser och dessutom med hjälp av OverlapThreshold möjliggöra en hopslagning av relaterade delbetydelser.

Baserat på särdragstilldelningen och variabeln SynsetLimit så tilldelas ord i

lexikoningången olika semantiska kategorier: synonymer, hyponymer, hypernymer och relaterade ord och antalet delbetydelser kan ändras baserat på särdragstilldelningen och variabeln OverlapThreshold. Men en mänsklig bedömare måste avgöra vilka

tröskelvärden på OverlapThreshold och SynsetLimit som genererar det bästa resultatet för varje enskilt ord. Dessutom kan både indelningen i semantiska kategorier och delbetydelser kännas godtycklig och metoden borde antingen utvecklas för bättre automatisk indelning, det vill säga tolkning av särdragsstrukturerna, eller tillåta den mänskliga användaren större friheter.

6.3.2 Fullständig automatisering

Semantisk spegling förutsätter en mänsklig bedömare för att manipulera lexikoningångarna så att det bästa resultatet av uppdelning i delbetydelser och indelning i olika semantiska kategorierna kan uppnås. Detta innebär ett ganska tidskrävande arbete om stora datamängder används. Om det istället kunde ske

automatiskt så skulle dels behovet av mänskliga bedömare minimeras och dels så skulle metoden kunna användas på två helt okända språk. En möjlig väg att uppnå fullständig automatik skulle vara att analysera särdragsstrukturerna och baserat på semantisk närhet; delade särdrag, och antalet ord i särdragstrukturerna kunna beräkna vilka värden på OverlapThreshold och SynsetLimit som bör användas. Konsekvensen skulle i bästa fall bli att embryon till synonymordböcker på vilka två språk som helst snabbt skulle kunna skapas.

6.3.3 Andra ordklasser

Det verkar inte finnas några teoretiska invändningar mot att använda semantisk spegling på exempelvis substantiv eller verb. Möjligen skulle användandet av

ordboksdata innebära färre specificeringar eller generaliseringar av substantiv än vad korpusdata skulle erbjuda vilket skulle innebära sämre möjligheter att utnyttja

överlappande översättningar med semantisk spegling. Varken WordNet eller Merriam- Webster anger hyponymer eller hypernymer till adjektiv utan bara synonymer och relaterade ord. Jag tror att det kan vara en vettig strategi att anpassa de semantiska kategorierna efter ordklass eftersom exempelvis adjektiv har ett mera nätverksliknande inbördes förhållande än exempelvis substantiv, som har ett mera hierarkiskt inbördes förhållande.

Related documents