• No results found

En teknik som tyv¨arr inte anv¨ands i systemet ¨ar att GIZA++ kan ge ett flertal l¨ankningsalternativ. Ist¨allet till˚ats GIZA++ sj¨alv v¨alja det

alternativ som det sj¨alv rankar som b¨ast. Det skulle kunna g˚a att l˚ata anv¨andaren ist¨allet v¨alja mellan ett par av dessa l¨ankningsalternativ. Detta skulle ¨aven kunna kombineras med I*Links redigeringsmetod om man l˚ater anv¨andaren f¨orst v¨alja mellan ett par alternativ och sedan verifiera eller modifiera varje ord i meningen.

Automatisk ordklasstaggning vore en m¨ojlig utvidgning av programmet. Detta skulle f¨orse anv¨andaren med mer information om texterna och samtidigt underl¨atta framtagning av TEM-ramar, d˚a n˚agra av ramarna kr¨aver detta.

Att separera l¨ankningssystem och anv¨andargr¨anssnitt genom en server- och klient-del ¨ar ocks˚a en m¨ojlighet. Detta skulle kunna realiseras med en central serverdel som inneh˚aller l¨ankningssystem och d¨ar klienten skickar texterna f¨or bearbetning genom en klient. Klienten skulle inte beh¨ova inneh˚alla n˚agra externa verktyg utan skulle enbart anv¨andas f¨or att visualisera eller redigering texten. Med en klient skulle till exempel en l¨arare kunna skapa en uppgift, som eleverna sen kommer ˚at och kan l¨anka sin text emot. Detta skulle ge m¨ojlighet f¨or ett mer sofistikerat system f¨or l¨ankning som kan utnyttja data fr˚an flera ¨overs¨attningar. I ett s˚adant system skulle b˚ade statistik och m¨ojligtvis ¨aven maskininl¨arning vara m¨ojligt.

6

Slutsats

Syftet med detta arbete var att skapa ett program som utnyttjar

existerande verktyg f¨or att l¨anka tv˚a parallella texter. Programmet skulle kunna l¨anka automatiskt, samt kunna visualisera och ge anv¨andaren m¨ojlighet att redigera denna l¨ankning. Det skulle ¨aven kunna betygs¨atta en ¨overs¨attning med hj¨alp av TEM.

Programmet som skapats till˚ater en anv¨andare att l¨anka tv˚a parallella texter med varandra och anv¨ander sig av tv˚a system f¨or automatisk l¨ankning, ett p˚a meningsniv˚a och ett p˚a ordniv˚a. Det till˚ater redigering och visualisering av denna l¨ankning p˚a b˚ade menings- och ord-niv˚a. Det ¨ar ¨

aven anpassat till att kunna r¨akna ut och visa vissa ramar inom TEM.

Programmet kan anv¨andas av n˚agon utan djupare kunskaper om l¨ankning och l¨ankningssystem. Hur anv¨andarv¨anligt och anv¨andbart programmet ¨ar i sitt nuvarande format ¨ar diskuterbart. M˚alet att programmet skulle kunna anv¨andas i spr˚akutbildningar har med stor sannolikhet inte n˚atts. F¨or att programmet ska ˚astadkomma detta kr¨avs ett par utvidgningar har programmet och m¨ojligtvis en mer komplett l¨osning d¨ar samtliga externa system ist¨allet ¨ar helt integrerade.

Referenser

[1] Ljuba Tarvi (2006). Comparative Translation Assessment: Quantifying Quality.

[2] Lars Ahrenberg, Ljuba Tarvi (2013). Natural Language Processing for the Translation Class. In proc. Of the second workshop on NLP for computer-assisted language learning , Oslo, Norway.

[3] http://anymalign.limsi.fr/ (h¨amtad 2015-01-12)

[4] Adrien Lardilleux, Yves Lepage. (2009) Sampling-based multilingual alignment. International Conference on Recent Advances in Natural Language Processing (RANLP 2009), Borovets, Bulgaria, September 2009.

[5] Franz Josef Och, Hermann Ney.(2003) A Systematic Comparison of Various Statistical Alignment Models, Computational Linguistics, volume 29, number 1, pp. 19-51 March 2003.

[6] D´aniel Varga, L´aszl´o N´emeth, P´eter Hal´acsy, Andr´as Kornai, Viktor Tr´on, Viktor Nagy (2005).Parallel corpora for medium density languages In Proceedings of the RANLP 2005, pages 590-596 [7] I. Dan Melamed (1996). A Geometric Approach to Mapping Bitext

Correspondence, IRCS Technical Report 96-22, a revised version of the paper presented at the First Conference on Empirical Methods in Natural Language Processing (EMNLP’96), Philadelphia, PA, May. [8] http://nlp.cs.nyu.edu/GMA/ (h¨amtad 2015-01-12)

[9] Noah A. Smith, Michael E. Jahr. (2000). Cairo:An alignment

visualization tool. In Second In-ternational Conference on Linguistic Resourcesand Evaluation

[10] http://www.ida.liu.se/labs/nlplab/ILink/readme.htm (h¨amtad 2015-01-12)

[11] Ulrich Germann (2008) Yawat: Yet Another Word Alignment Tool. Proceedings of the ACL-08: HLT Demo Session (Companion Volume), pages 20–23

[12] Shari Lawrence Pfleeger, Joanne M. Atlee (2009) Software Engineering - Theory and Practice, 4th edition, Pearson Education International. [13] Philipp Koehn (2005) Europarl: A Parallel Corpus for Statistical

På svenska

Detta dokument hålls tillgängligt på Internet – eller dess framtida ersättare –

under en längre tid från publiceringsdatum under förutsättning att inga extra-

ordinära omständigheter uppstår.

Tillgång till dokumentet innebär tillstånd för var och en att läsa, ladda ner,

skriva ut enstaka kopior för enskilt bruk och att använda det oförändrat för

ickekommersiell forskning och för undervisning. Överföring av upphovsrätten

vid en senare tidpunkt kan inte upphäva detta tillstånd. All annan användning av

dokumentet kräver upphovsmannens medgivande. För att garantera äktheten,

säkerheten och tillgängligheten finns det lösningar av teknisk och administrativ

art.

Upphovsmannens ideella rätt innefattar rätt att bli nämnd som upphovsman i

den omfattning som god sed kräver vid användning av dokumentet på ovan

beskrivna sätt samt skydd mot att dokumentet ändras eller presenteras i sådan

form eller i sådant sammanhang som är kränkande för upphovsmannens litterära

eller konstnärliga anseende eller egenart.

För ytterligare information om Linköping University Electronic Press se

förlagets hemsida http://www.ep.liu.se/

In English

The publishers will keep this document online on the Internet - or its possible

replacement - for a considerable time from the date of publication barring

exceptional circumstances.

The online availability of the document implies a permanent permission for

anyone to read, to download, to print out single copies for your own use and to

use it unchanged for any non-commercial research and educational purpose.

Subsequent transfers of copyright cannot revoke this permission. All other uses

of the document are conditional on the consent of the copyright owner. The

publisher has taken technical and administrative measures to assure authenticity,

security and accessibility.

According to intellectual property law the author has the right to be

mentioned when his/her work is accessed as described above and to be protected

against infringement.

For additional information about the Linköping University Electronic Press

and its procedures for publication and for assurance of document integrity,

please refer to its WWW home page: http://www.ep.liu.se/

Related documents