En teknik som tyv¨arr inte anv¨ands i systemet ¨ar att GIZA++ kan ge ett flertal l¨ankningsalternativ. Ist¨allet till˚ats GIZA++ sj¨alv v¨alja det
alternativ som det sj¨alv rankar som b¨ast. Det skulle kunna g˚a att l˚ata anv¨andaren ist¨allet v¨alja mellan ett par av dessa l¨ankningsalternativ. Detta skulle ¨aven kunna kombineras med I*Links redigeringsmetod om man l˚ater anv¨andaren f¨orst v¨alja mellan ett par alternativ och sedan verifiera eller modifiera varje ord i meningen.
Automatisk ordklasstaggning vore en m¨ojlig utvidgning av programmet. Detta skulle f¨orse anv¨andaren med mer information om texterna och samtidigt underl¨atta framtagning av TEM-ramar, d˚a n˚agra av ramarna kr¨aver detta.
Att separera l¨ankningssystem och anv¨andargr¨anssnitt genom en server- och klient-del ¨ar ocks˚a en m¨ojlighet. Detta skulle kunna realiseras med en central serverdel som inneh˚aller l¨ankningssystem och d¨ar klienten skickar texterna f¨or bearbetning genom en klient. Klienten skulle inte beh¨ova inneh˚alla n˚agra externa verktyg utan skulle enbart anv¨andas f¨or att visualisera eller redigering texten. Med en klient skulle till exempel en l¨arare kunna skapa en uppgift, som eleverna sen kommer ˚at och kan l¨anka sin text emot. Detta skulle ge m¨ojlighet f¨or ett mer sofistikerat system f¨or l¨ankning som kan utnyttja data fr˚an flera ¨overs¨attningar. I ett s˚adant system skulle b˚ade statistik och m¨ojligtvis ¨aven maskininl¨arning vara m¨ojligt.
6
Slutsats
Syftet med detta arbete var att skapa ett program som utnyttjar
existerande verktyg f¨or att l¨anka tv˚a parallella texter. Programmet skulle kunna l¨anka automatiskt, samt kunna visualisera och ge anv¨andaren m¨ojlighet att redigera denna l¨ankning. Det skulle ¨aven kunna betygs¨atta en ¨overs¨attning med hj¨alp av TEM.
Programmet som skapats till˚ater en anv¨andare att l¨anka tv˚a parallella texter med varandra och anv¨ander sig av tv˚a system f¨or automatisk l¨ankning, ett p˚a meningsniv˚a och ett p˚a ordniv˚a. Det till˚ater redigering och visualisering av denna l¨ankning p˚a b˚ade menings- och ord-niv˚a. Det ¨ar ¨
aven anpassat till att kunna r¨akna ut och visa vissa ramar inom TEM.
Programmet kan anv¨andas av n˚agon utan djupare kunskaper om l¨ankning och l¨ankningssystem. Hur anv¨andarv¨anligt och anv¨andbart programmet ¨ar i sitt nuvarande format ¨ar diskuterbart. M˚alet att programmet skulle kunna anv¨andas i spr˚akutbildningar har med stor sannolikhet inte n˚atts. F¨or att programmet ska ˚astadkomma detta kr¨avs ett par utvidgningar har programmet och m¨ojligtvis en mer komplett l¨osning d¨ar samtliga externa system ist¨allet ¨ar helt integrerade.
Referenser
[1] Ljuba Tarvi (2006). Comparative Translation Assessment: Quantifying Quality.
[2] Lars Ahrenberg, Ljuba Tarvi (2013). Natural Language Processing for the Translation Class. In proc. Of the second workshop on NLP for computer-assisted language learning , Oslo, Norway.
[3] http://anymalign.limsi.fr/ (h¨amtad 2015-01-12)
[4] Adrien Lardilleux, Yves Lepage. (2009) Sampling-based multilingual alignment. International Conference on Recent Advances in Natural Language Processing (RANLP 2009), Borovets, Bulgaria, September 2009.
[5] Franz Josef Och, Hermann Ney.(2003) A Systematic Comparison of Various Statistical Alignment Models, Computational Linguistics, volume 29, number 1, pp. 19-51 March 2003.
[6] D´aniel Varga, L´aszl´o N´emeth, P´eter Hal´acsy, Andr´as Kornai, Viktor Tr´on, Viktor Nagy (2005).Parallel corpora for medium density languages In Proceedings of the RANLP 2005, pages 590-596 [7] I. Dan Melamed (1996). A Geometric Approach to Mapping Bitext
Correspondence, IRCS Technical Report 96-22, a revised version of the paper presented at the First Conference on Empirical Methods in Natural Language Processing (EMNLP’96), Philadelphia, PA, May. [8] http://nlp.cs.nyu.edu/GMA/ (h¨amtad 2015-01-12)
[9] Noah A. Smith, Michael E. Jahr. (2000). Cairo:An alignment
visualization tool. In Second In-ternational Conference on Linguistic Resourcesand Evaluation
[10] http://www.ida.liu.se/labs/nlplab/ILink/readme.htm (h¨amtad 2015-01-12)
[11] Ulrich Germann (2008) Yawat: Yet Another Word Alignment Tool. Proceedings of the ACL-08: HLT Demo Session (Companion Volume), pages 20–23
[12] Shari Lawrence Pfleeger, Joanne M. Atlee (2009) Software Engineering - Theory and Practice, 4th edition, Pearson Education International. [13] Philipp Koehn (2005) Europarl: A Parallel Corpus for Statistical