• No results found

Mjukvarugenererad poesi

N/A
N/A
Protected

Academic year: 2021

Share "Mjukvarugenererad poesi"

Copied!
31
0
0

Loading.... (view fulltext now)

Full text

(1)

Mjukvarugenererad poesi

JOEL TJÄRNSTIG, JOELT@KTH.SE ERIK RINGDAHL, ERIKRIN@KTH.SE

SKOLAN FÖR DATAVETENSKAP OCH KOMMUNIKATION, KUNGLIGA TEKNISKA HÖGSKOLAN, STOCKHOLM, SVERIGE

Kandidatexamensrapport vid NADA Handledare: Gabriel Skantze Examinator: Karl Meinke, Örjan Ekeberg

(2)
(3)

iii

Abstract

(4)

Sammanfattning

(5)

Innehåll

1 Introduktion 1 1.1 Problemformulering . . . 1 1.2 Syfte . . . 2 1.3 Bakgrund . . . 2 1.3.1 Generering av naturligt språk . . . 2 1.3.2 Fonetik . . . 3

1.3.3 Rim och versmått . . . 4

1.3.4 Vad gör poesi bra? . . . 5

2 Metod 7 2.1 Initialisering av mjukvaran . . . 7

2.1.1 En beskrivning av korpusen . . . 7

2.1.2 Val av storleken på N-gram . . . 8

2.1.3 Mjukvarans bedömning av ordföljder och kontextord . . . 8

2.1.4 Val av versmått . . . 9

2.2 Exekvering . . . 9

2.2.1 Temaord som indata . . . 9

2.2.2 Kontext . . . 9

2.2.3 Revision . . . 10

2.3 Tester . . . 11

3 Resultat 12 3.1 Korsrim - Ett temaord . . . 13

3.2 Korsrim - Fem temaord . . . 14

3.3 Limerick - Ett temaord . . . 15

3.4 Limerick - Fem temaord . . . 16

4 Diskussion 17

5 Slutsats 19

Litteraturförteckning 20

A Fonetisk transkription 21

(6)

B Genererad poesi - ett urval 22

B.1 Limerick med ett temaord . . . 22

B.2 Limerick med fem temaord . . . 22

B.3 Korsrim med ett temaord . . . 23

B.4 Korsrim med fem temaord . . . 23

C Genererad kontext 24 C.1 Ett temaord - kärlek . . . 24

(7)

Kapitel 1

Introduktion

Språk är ett extremt komplext forskningsområde och innehåller tvetydiga defin-tioner, subjektiva tolkningar och en avancerad syntax. Poesin adderar ännu ett abstraktionslager till språket som leder till ytterligare komplexitet. Även om poesin tillåter en tänjning av språkliga regler innehåller den också egna regler, bestämmel-ser och traditioner. Dessa innefattar språkliga element såsom rim, rytm och även en vilja att skapa ett estetiskt värde eller syfte. För en människa tar det flera år att lära sig behärska ett språk på grundläggande nivå och förmågan att skriva poesi kräver ytterligare kunskap och lärande.

Att simulera ett livslångt lärande och genom detta sedan konstruera mjukvara för att generera poesi kan tyckas omöjligt. Med modern teknik och enkel tillgång till stora textmängder tillåts dock alternativa metoder. Istället för att försöka generera text från grunden kan stora textmängder analyseras och bearbetas, för att på så sätt kringgå problemet att behöva lära en mjukvara språkuppbyggnad. Ordföljder och formuleringar tas istället direkt från textmängderna och kombineras sedan för att skapa nya texter.

I denna uppsats utforskar vi hur dessa texter kan revideras och omformuleras för att på så sätt generera poesi och om dessa kan bedömas på ett objektivt sätt.

1.1

Problemformulering

Språkets komplexitet och poesins fria ramverk skapar konflikter med en mjukvaras strikt logiska uppbyggnad. Dessa konflikter ger upphov till många frågeställningar varav denna undersökning ämnar att svara på följande:

• Kan man med hjälp av mjukvara generera poesi?

(8)

1.2

Syfte

Syftet med undersökningen är att försöka generera poetiska texter utifrån ett givet tema med enkla medel. Vidare undersöks hur väl en objektiv bedöming utifrån givna kriterier matchar en läsares subjektiva bedöming.

1.3

Bakgrund

1.3.1 Generering av naturligt språk

Utvecklingen av språkgeneratorer har visat en nästan paradoxal utvecklingskurva [6]. I takt med att teknikerna för genereringen blev allt mer avancerade, blev utdatan simplare. Inte förrän på senare tid har utvecklingen vänt och utdatan har blivit mer sofistikerad och börjat likna texter skrivna av människor. Ett utav de främsta ex-emplen från språkgenereringens barndom är John Clippingers program Erma(1977) som försökte efterlikna en terapipatient[6]. Erma byggde på stora mängder tran-skriberade terapisessioner som genom en komplex beräkningsmodell genererade en paragraf med häpnadsväckande naturligt språk.

»You know for some reason I just thought about the bill and payment again. (You shouldn’t give me a bill.) <Uh> I was thinking that I (shouldn’t be given a bill) of asking you whether it wouldn’t be all right for you not to give me a bill. That is, I usually by (the end of the month know the amount of the bill), well, I immediately thought of the objections to this, but my idea was that I would simply count up the number of hours and give you a check at the end of the month.«

Erma genererade dock endast denna paragraf och arbetet följdes aldrig upp eller

utvecklades vidare.

Under 80-talet började ämnet locka allt fler seriösa forskningsgrupper och det gjor-des stora framsteg inom området. Genereringsprocessen moduleragjor-des och delagjor-des upp i ett antal mindre processer som tog hand om separata delar av den gramma-tiska uppbyggnaden. Med hjälp av de nyutvecklade metoderna kunde man generera korrekt språk med relativt lite indata och utan efterarbete. Språket var dock meka-niskt och saknade de mänskliga dimensionerna som Erma uppvisade.

På 90-talet utvecklades en metod för att förfina 80-talets mekaniska språk med hjälp av revision [6]. Meningar med uppstolpad fakta analyserades och komplette-rades med yttligare information för att förmedla faktan på ett mer naturligt sätt. Revisionen var dock beroende av en kontext för att kunna komplettera med korrekt information. Jacques Robins program Streak utnyttjade revision där kontexten var sport. Med hjälp av detta kunde en mening innehållande kortfattad information om en basketmatch kompletteras med statistik och ytterligare fakta.

(9)

1.3. BAKGRUND 3

Texten revideras i flera omgångar och resultatet är mer naturligt och ger en mer levande beskrivning.

»Dallas, TX - Charles Barkley tied a season high with 42 points and Danny Ainge came off the bench to add 21 Sunday as the Phoenix Suns handed the Dallas Macericks their league worst 13th straight home defeat 123-97«

Revisionstekniken kräver dock uppenbarligen att det finns en befintlig text att revidera.

N-gram och textkorpusar

En av de äldsta och mest utbredda modellerna för språkgenerering är med hjälp av korpusbaserade N-gram[7]. Ordet korpus kommer från latinets corpus och betyder kropp. Inom lingvistiken används ordet korpus för att syfta till en mängd text.

N-gram är ett sätt att fördela korpusen i behandlingsbara delar. Dessa delar innehåller

då N antal ord vardera. N-gram med två ord kallas bigram och N-gram med tre ord kallas trigram. Till exempel ger frasen »jag har en blå bil och en blå fågel« följande trigram: »jag har en«, »har en blå«, »en blå bil«, »bil och en«, »och en blå«, »en blå fågel«. Med hjälp av dessa trigram kan sedan sannolikheten för ordföljder beräknas. Sannolikheten för ett visst N-gram är den betingade sannolikheten för något ord förutsatt de tidigare N-1 orden [7].

Ett N-grams förmåga att förutse ett nästkommande ord är alltså helt beroen-de av korpusens storlek och innehåll. För att ytterligare förbättra precisionen kan värdet för N ökas. Detta innebär dock att genereringen blir mer krävande och språ-ket som genereras blir allt mer likt språsprå-ket i korpusen. För att generera orginella formuleringar kan ett mindre värde på N vara att föredra, dock på bekostnad av ordförslagens riktighet. N-gram placerar även orden i en kontext. Kontexten må vara begränsad vid användning av till exempel trigram, då kontexten endast består av två andra ord. Men tillsammans med den betingade sannolikheten kan den be-gränsade kontexten komma att blir ett användbart verktyg. För att vidare bearbeta korpusen kan varje ord i ett N-gram delas upp i dess beståndsdelar. Detta görs med hjälp av fonetiska regler (1.3.2 Fonetik).

1.3.2 Fonetik

(10)

tidigare[8]. Vanligtvis används dessa regler helt omedvetet av läsaren/talaren och en komplex process som krävt mycket övning och inlärning, har i stort sett blivit helt automatiserad. Detta är en eftersträvnadsvärd utvecklingsgång och kan med rätt medel efterliknas med hjälp av maskininlärning. Maskininlärningen kräver reg-ler och begränsningar för att kunna bygga upp en logik som kan tolka betydelser, uttal, räkna stavelser och rimma (1.3.3 Rim och versmått).

Fonologiska regler bryter ned orden i dess beståndsdelar enligt ett utarbetat

sy-stem. Det svenska fonologiska systemet är komplext och kommer inte att tas upp i sin helhet utan fokus kommer att ligga på de delar som är centrala för maskininlär-ningen. På grund av hononymin i språk kan rim inte baseras på stavning utan kräver information om hur orden uttalas. Dialekter skapar ännu en dimension och separata fonetiska regler gäller för olika dialekter. För att underlätta har fonologiska regler för »mellansvenskt riksspråk« använts under undersökningen. De fonologiska reg-lerna representeras med RULSYS-notation. RULSYS-notationen är en anpassning av det svenska fonologiska systemet för att underlätta vid maskinläsning (se tabell A.1 på sida 21 för fullständig fonologisk förteckning). Till exempel har ordet »bar« den fonetiska beteckningen »B’A:R«. Den huvudbetonade vokalen är »a« och detta markeras med tecknet »’« före bokstaven i fråga. För sammansatta ord markeras den huvudbetonade vokalen med tecknet »”« och den sekundärbetonade med »‘«. Till exempel får ordet »barstol« den fonetiska beteckningen »B”A:hy2S2T‘O:L«. Anta-let stavelser i ett ord är beroende av dialekt och betoning och det finns ingen allmän bestämd definition för att räkna dessa. En ungefärlig definition är att en stavelse är ett »vokallikt« ljud tillsamans med den närmast »ihopkopplade« konsonanten [7]. Maskininlärningen och språkgenereringen kräver strikta regler och antalet stavelser kommer i fortsättningen av undersökningen att definieras som »antalet vokaler med intilliggande konsonanter«.

1.3.3 Rim och versmått

Ett rim kan vardagligt definieras som två ord där slutet av dessa ord uttalas på samma sätt [3]. Uttalet av orden avgörs av dess betoning och betoningarna jämförs sedan med hjälp av »fonetiska representationer« (1.3.2 Fonetik). Med hjälp av detta avgörs slutligen hurvida ord rimmar eller ej.

Rimmat har man gjort i alla tider [5]. Uråldriga kulturer har nyttjat rimmets förmåga att förstärka och rytmera besvärjelser och signelser. Rim som regel och strukturell grund för poesi är dock en senare förekommen praxis. De äldsta do-kumenterade exemplen syns redan 100 e.Kr. Här var kraven på rimmens exakthet relativt lågt och oftast rimmade man endast på obetonade slutvokaler [5].

Numera kännetecknas poesin genom upprepningar och rim, rimmen förekommer ofta som det sista ordet i en versrad. Ett sådant rim kallas slutrim och fungerar som en gränsmarkering för versraden och får även texten att låta mer som poesi [5]. Med hjälp av slutrimmen kan man sedan föra samman rimmande versrader till

strofer. Versraderna binds ihop till strofer med hjälp av olika versmått. Versmåttet

(11)

1.3. BAKGRUND 5

innehålla. Rimmande rader markeras med bokstäver där rader som rimmar tilldelas samma bokstav. Detta kallas rimschema. För att även ta hänsyn till metriken, i detta fall, hur många stavelser varje rad har, måste även detta tilldelas ett tecken. För att underlätta maskininläsningen kommer detta fortsättningsvis endast anges med en siffra.

Men en båt dröjde, A 5 och det var den sista. B 6 Den natt den förtöjde A 6 låg skepparens hustru, X 6 död i sin kista. B 5

(Ebba Lindqvist, Fiskare kommer hem från Shetland, 1939 )

Denna dikt ger oss alltså rimschemat »ABAXB«. Där första och tredje raden rimmar med varandra och innehåller fem respektive sex stavelser. Andra och femte raden rimmar med varandra och innehåller sex respektive fem stavelser. Fjärde ra-den markeras med ett X eftersom ra-den är helt fristående, med avseende på rim från andra rader och innehåller sex stavelser. Versmått där antalet stavelser upprepas genom flera versrader kallas syllabisk och ett klassiskt exempel på detta är

lime-ricken. En limerick ska ha rimschemat »AABBA« där antalet stavelser för första,

andra och femte raden vanligen ska vara åtta eller nio och den tredje och fjärde raden ska ha fem eller sex stavelser.

En utlevad herre i Hessen, A 9 Har mycket aparta intressen: A 9 Han vill älska i gröt, B 6 endast iklädd en söt B 6 liten pappershatt, vikt av Expressen! A 9 (Hasse Alfredson, En något större bok, 1985 )

Poetiska texter finns i många olika former, där versmåttet kan ses som ett ramverk för strukturen på texten. Det finns många olika sätt att ange versmåttet och innefattar som visat ovan, till exempel ett rimschema och stavelseantal. Versradens metrik kan vidareutvecklas för att även ta hänsyn till rytm och betoning, men detta är utanför detta projekts omfattning.

1.3.4 Vad gör poesi bra?

(12)

En av de mest framstående egenskaperna hos poesi i alla dess former är dess fria ramverk. Kultur, traditioner och tidigare verk påverkar starkt författandet av poesi. Men i grund och botten är poesin fri och detta utgör ett fundamentalt problem när poesiskapandet ska förenklas och automatiseras. För att kunna generera naturligt språk används med fördel en kontext som den genererade texten kan skapas ur samt revideras och jämföras mot, som nämnt i tidigare stycke. Poesins fria ramverk gör att en allmän poetisk kontext blir alltför svårdefinerad och det krävs kraftiga begräns-ningar av kontexten samt strikta regler för att den automatiserade processen och genererade resultat ska kunna utvärderas. Dessa begränsningar består i detta fallet av versmått definierade enligt bestämmelserna i föregående kapitel (1.3.3 Rim och versmått) samt ett på förhand angivet tema (2.2.1 Temaord som indata). Fonetiska regler (1.3.2 Fonetik) och ordklasser möjliggör yttligare förfining av kontexten.

Rimscheman formar texten och tillsammans med en bestämd metrik skapas texter med varierande uttryck. Parrimmande texter ger till exempel ett intryck av enkelhet hos läsaren medan överraskningsmoment och sviken rimförväntan kan ge en upplevelse av djupsinnighet[5]. Vidare tillför rimmande ord som tillhör skilda ordklasser kontrast och identitet till texten. Det svenska språket anses vara begrän-sat med avseende på rimord vilket förminskar möjligheterna att generera originella rim. Vanerim är rim som ger ett klichéartat intryck och kan lätt tömma poesin på betydelse och till och med addera oönskad komik[5]. Vanerim handlar ofta om kär-lek, död eller religion och förekommer ofta i till exempel psalmer eller barnsånger. Urtyperna för svenska vanerim är bland annat »hjärta« - »smärta«, »öm« - »dröm«, »tröst« - »bröst« eller »nöd« - »död«. Detta kan dock med simpla medel undvikas genom begränsingar där vanerim helt enkelt exkluderas under genereringen om så önskas.

(13)

Kapitel 2

Metod

Genereringsprocessen bygger på korpusbaserade N-gram (1.3.1 Generering av na-turligt språk). Mjukvaran är uppdelad i två huvudprocesser, en initialiserande och en exekverande. Metoden med N-gram valdes för att den erbjuder en pålitlig språkgenerering utan att behöva lära mjukvaran komplexa grammatiska regler. För att generera poesi från prosa används en kombination av revision med temabaserad kontext och versmått med rimschema samt stavelseräkning. För att utvärdera har en kvantitativ undersökning gjorts där resultatet från genereringen har poängsatts av en testgrupp på tio personer. Testgruppens poäng jämförs sedan mot mjukvarans poängsättning (2.3 Tester).

2.1

Initialisering av mjukvaran

Initialiseringen lägger grunden för exekveringen och är helt ansvarig för de resulte-rande ordföljderna. Det är denna process som ersätter mjukvarans behov av gram-matisk förståelse. Istället skapas en stor databas av N-gram som sedan används vid exekveringen.

2.1.1 En beskrivning av korpusen

Korpusen som används vid genereringen är ett resultat av EU-projektet »PARO-LE«. Projektet avslutades 1997 och avsedde att bygga upp ett nätverk av språkliga resurser[1]. Korpusen består av cirka 19 miljoner löpande ord från svenska dagstid-ningar vilket ger en stor variation på formuleringar och ordval. Korpusen tillhan-dahåller även en morfosyntaktisk representation av varje ord. Detta är ett sätt att ange ordets form i förhållande till kringliggande ord. Morfologin är en fundamental del av revision (1.3.1 Generering av naturligt språk) då formuleringar ska få större omfattning och ord ska bytas ut.

(14)

2.1.2 Val av storleken på N-gram

Den valda korpusen kommer att representeras med bigram och trigram. Trigram används för att få en bra kontext och för att valet av nästkommande ord ska ge tillfreställande resultat (2.1.3 Mjukvarans bedömning av ordföljder och kontextord). Om ingen matchning hittas med hjälp av trigram används istället bigram som ga-ranterar att en matchning hittas. Dock till kostnad av kontexten. En separat repre-sentation med omkastade N-gram görs även för att ha möjlighet att generera text »baklänges«. Detta fungerar på samma sätt som vanlig generering med skillnaden att genereringen startar med sista ordet i raden och arbetar sig bakåt mot första ordet. Den omvända genereringen visade sig vara avgörande för versrader med

slut-rim (1.3.3 Rim och versmått). Istället för att generera ett stort antal rader med

förhoppningen att sluta på ett ord som rimmar med föregående rad, utgick gene-reringen ifrån ett rimmande ord och gick baklänges för att skapa en versrad med slutrim.

2.1.3 Mjukvarans bedömning av ordföljder och kontextord

För att bestämma nästkommande ord används ett enkelt poängsystem som räknar antalet förekomster av varje trigram. Dessa representeras i en indexfil på följande sätt:

aldrig att den 2 aldrig att det 3 aldrig att du 2 aldrig att egga 1

För att välja nästkommande ord till bigrammet »aldrig att« tycks alltså »det« vara det bästa alternativet. Att ständigt välja det mest förekommande ordet vid genereringen visade sig dock vara ogynnsamt. Vissa trigram förekommer väldigt ofta och de genererade raderna kommer då om de innehåller många ord alltid att innehålla dessa trigram. Följden av detta är att raderna »går mot« en viss ord-följd; »..det var en av de första åren..«. Så fort bigrammet »det var« förekommer, kommer alltså ordföljden bli densamma. Detta undviks genom att inkludera en viss slumpmässighet i ordvalet. Istället för att det ord med högst poäng alltid väljs, skapas en mängd med alla möjliga ordförslag där nästkommande ord sedan väljs slumpmässigt utifrån denna mängd. Poängen används istället för att bedöma den färdiga versraden (2.1). Ett ords poäng wi adderas med en kontextpoäng c(wi) för ordet. c(wi) = 0 om ordet inte förekommer i kontexten och c(wi) = 10 om den

förekommer. R(w0, w1, ..., wn) = n X i=0 (wi+ c(wi)) (2.1)

(15)

genere-2.2. EXEKVERING 9 rade texten. P (R0, R1, ..., Rn) = n X i=0 Ri (2.2) 2.1.4 Val av versmått

Versmåtten som användes under genereringen innefattade ett korsrimmande versmått

V1 med rimschemat »ABAB« och versmåttet för limerickar V2 med rimschemat

»AABBA« (1.3.3 Rim och versmått).

V1= [(ABAB)] (2.3)

V2 = [(AABBA), (99669)] (2.4)

Det korsrimmande versmåttet (2.3) som används tar ingen notis om antal stavel-ser för varje versrad och kan ses som en mindre strikt form av limericken. Limericken (2.4) definierades med nio stavelser för första, andra och femte raden och sex stycken för rad tre och fyra. Dessa två versmått valdes för kunna jämföra i vilken utsträck-ning striktheten på versmåttet påverkar kvaliteten på den genererade texten.

2.2

Exekvering

2.2.1 Temaord som indata

Utgångspunkten för genereringen består av temaord. Dessa temaord anges av an-vändaren och kommer att utgöra en del av kontexten (2.2.2 Kontext) för poesin som genereras. Antalet temaord som kan anges är obegränsat men det krävs minst ett ord för att starta genereringen. För att skapa mätbara resultat krävs dock att antalet temaord sätts till fixa storlekar så att resultat från en generering med få temaord kan jämföras mot en generering med ett större antal temaord. Under exe-kveringen kommer två olika antal temaord för varje versmått att undersökas. Först kommer generering att ske med endast ett temaord. Sedan kommer en mängd med fem temaord att användas, där temaordet från första körningen även kommer att in-gå. Temaordsmängden behöver inte ha något inbördes samband men genereringens slumpartade natur gör att ett övergripande tema i mängden kan ge mer tillfredstäl-lande resultat.

2.2.2 Kontext

(16)

sig till ett specifikt angivet tema krävs mer än så. För att skapa en kontext utifrån angivna temaord användes två separata databaser.

SALDO är ett svenskt associationslexikon och en omfattande elektronisk

lexi-konresurs för modernt svenskt skriftspråk[2]. SALDO ger, givet ett ord, associationer till det angivna ordet. Associationerna används sedan för att bygga upp en kontext för de angivna temaorden. Om till exempel en användare har angett temaorden »glädje« och »vårdag« ger SALDO följande associationer:

glädje lycka njutning nöje trivsel vårdag dag tid ljus årstid

Kontexten utvecklas yttligare med hjälp av Synlex - Folkets synonymlexikon och tabellerna ovan innefattar nu även synonymer till alla funna associationer.

glädje

lycka lycklig upprymd överlycklig euforisk

njutning njuta skön välbehag tillfredställelse

nöje rolig störtskön glad upprymd

trivsel trivas må väl

vårdag

dag tid tidsrymd ljus optimistisk

tid när alltid ticka ständig

ljus optimistisk hoppas önska lysa

årstid år tid tidsrymd

Utifrån de två temaorden har det alltså skapats en mängd med 38 nya ord. Denna mängd kommer att utgöra kontexten för poesin som ska genereras. Kom-binationen av SALDO och Synlex valdes för att få en viss mångfald i kontexten. SALDO ger en akademisk deskription som främst är avsedd för språklig forskning, medan Synlex är ett öppet lexikon där vem som helst får ange synonymer. SALDO är helt automatiskt genererad utifrån andra språkliga verktyg. Detta resulterar i att vissa ords deskriptioner kan tyckas udda. Vidare är bidragen till Synlex säl-lan kontrollerade vilket resulterar i vissa felaktiga synonymer. Risken för felaktiga kontexter ansågs vara liten och fördelarna vägde upp.

2.2.3 Revision

(17)

2.3. TESTER 11

meningsuppbyggnaden och endast ändra syftningen. Revisionen begränsas till att endast byta ut ett ord per versrad. Detta görs för att i största mån behålla formu-leringar som N-grambaserad generering skapat. Revisionen ska alltså inte göra om jobbet utan endast förbättra resultatet. Revisionen innefattar även anpassning till angiven stavelsegräns när detta är aktuellt. I denna del av revisionen användes det faktum att N-gram genererar ett stort antal förslag för nästkommande ord. Genom detta kan ett urval göras där det ord som ger rätt antal totala stavelser väljas. Sta-velseanpassningen används endast under användning av versmåttet för limerickar (2.4) och inte för det korsrimmande versmåttet (2.3)

2.3

Tester

För att utvärdera de genererade dikterna, samt mjukvarans objektiva bedömning, får en testgrupp bestående av tio, på måfå utvalda personer uppgiften att subjek-tivt bedöma ett antal texter. Denna bedömning jämförs sedan med den objektiva bedömningen utförd av mjukvaran. Varje person i testgruppen får i uppgift att po-ängsätta dikterna utifrån formuleringarna på varje rad (ordpoäng) och hur väl den givna kontexten stämmer överens med textens innehåll (kontextpoäng). Ordpoäng sätts genom att testpersonen bedömer hur stor andel av varje rad som har en vettig ordföljd, oavsett sammanhang. Testpersonerna sätter en till två poäng per ord i en lyckad formulering och godtyckliga bonuspoäng mellan ett och två får tilldelas tex-ter där formuleringarna dessutom anses vara unika eller oväntade. Testpersonerna tilldelar tio kontextpoäng om en rad bedöms ha någon anknytning till temaorden som valdes för dikten. Tjugo kontextpoäng tilldelas de texter där fler än en rad med anknytning till temaorden. Trettio poäng tilldelas de texter där man anser att hela texten har anknytning till temaorden. För varje versmått och temaordantal kom-mer tjugo stycken texter att genereras. Det stora antalet texter valdes för att kunna jämföra bedömningarna på ett bra sätt och för att kunna se mönster i genereringen och den objektiva bedömningen.

(18)

Resultat

Resultaten från testerna presenteras här nedan med hjälp av fyra diagram. Dia-grammen visar poängsättningen från mjukvaran och testgruppen med avseende på ordpoäng och kontextpoäng (2.3 Tester). Testgruppens poäng är ett medelvärde av varje testpersons poäng. Poängen är grupperad för varje text där texterna är numrerade från ett till tjugo. Först behandlas resultaten från testerna med korsrim, sedan tester med limerickar. Ett urval av texter med högst poäng från testgruppen har även bifogats (se Bilaga B Genererad poesi - ett urval).

(19)

3.1. KORSRIM - ETT TEMAORD 13

3.1

Korsrim - Ett temaord

Testerna med ett temaord visade att en fjärdedel av den genererade poesin hade med temaordet att göra, enligt testgruppen. Mjukvarans revision resulterade i att passande kontextord byttes in i nästan samtliga fall. Endast en gång misslyckades revisionen och mjukvaran gav denna text noll kontextpoäng. Testgruppens bedöm-ning av samma text gav också noll kontextpoäng (se text nr 10 i Figur 3.1).

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 10 20 30 40 50

Mjukvara - Ordpoäng Mjukvara - Kontextpoäng Testgrupp - Ordpoäng Testgrupp - Kontextpoäng

Figur 3.1: Korsrim med ett temaord

Mjukvara Testgrupp

Ordpoäng 28 26

Kontextpoäng 15 3 Totalpoäng 43 29

(20)

3.2

Korsrim - Fem temaord

Korsrim med fem temaord gav något sämre kontextpoäng än korsrim med ett te-maord, enligt den tillfrågade testgruppen. Endast tre av texterna ansågs ha med temat att göra. Dock fick text nr 5 (Figur 3.2) högre kontextpoäng av testgruppen än av mjukvaran. Detta förekom endast denna gång under alla tester. Mjukvarans revision lyckades i samtliga fall och bytte ut minst ett ord per text. Mjukvarans poängsättning av ord visade i tre fall mycket höga poäng (se text nr 4,6 och 12 i Figur 3.2). Testgruppens ordpoäng visade ingen större variation. I fallen där väldigt låg poäng delades ut hade även mjukvaran angett en relativt låg ordpoäng (se text nr 8 och 11 i Figur 3.2). 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 20 40 60

Mjukvara - Ordpoäng Mjukvara - Kontextpoäng Testgrupp - Ordpoäng Testgrupp - Kontextpoäng

Figur 3.2: Korsrim med fem temaord

Mjukvara Testgrupp

Ordpoäng 32 12

Kontextpoäng 17 2 Totalpoäng 49 14

(21)

3.3. LIMERICK - ETT TEMAORD 15

3.3

Limerick - Ett temaord

Med versmåttet för limerick och med ett valt temaord gav mjukvaran överlag ett högre ordpoäng än testerna med korsrim. Precis som med korsrim där endast ett temaord angavs misslyckades revisionen här i ett fall (se text nr 3 Figur 3.3). Av testgruppen så ansågs en fjärdedel av texterna att ha med temat att göra. Test-gruppens ordpoäng höll samma nivå som under testerna med korsrim.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 20 40 60 80

Mjukvara - Ordpoäng Mjukvara - Kontextpoäng Testgrupp - Ordpoäng Testgrupp - Kontextpoäng

Figur 3.3: Limerick med ett temaord

Mjukvara Testgrupp

Ordpoäng 31 25

Kontextpoäng 22 5 Totalpoäng 53 30

(22)

3.4

Limerick - Fem temaord

Limerick med fem temaord gav den högsta sammanlagda ordpoängen av testgrup-pen. Dock ingår även de lägsta poängen för enskilda texter under hela testet (se text nr 6 och 15 i Figur 3.4). Precis som i testerna med korsrim gav fem temaord något lägre kontextpoäng av testgruppen än testerna med ett temaord. Revisionen lycka-des dock i samtliga fall och i ett fall fick en text exakt samma poäng av mjukvaran som av testgruppen. Denna text var även den text som fick högst sammanlagda poäng av testgruppen under hela testet (se text nr 16 i Figur 3.4 och text nr 3 i Bilaga B). 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 20 40 60 80

Mjukvara - Ordpoäng Mjukvara - Kontextpoäng Testgrupp - Ordpoäng Testgrupp - Kontextpoäng

Figur 3.4: Limerick med fem temaord

Mjukvara Testgrupp

Ordpoäng 32 29

Kontextpoäng 29 2 Totalpoäng 61 31

(23)

Kapitel 4

Diskussion

Resultatet visar att den objektiva bedömningen av mjukvaran har en större varia-tion än den subjektiva bedömningen av testgruppen. Detta kan bero på att distru-bitionen av trigrammens rankingpoäng är ojämn. De allra flesta trigram har en låg poäng och en liten del har en extremt hög poäng. Trigrammet »det var en« ger till exempel 651 poäng vilket ger en ojämn fördelning av ordpoäng. Poängtopparna i den objektiva bedömningen tycks inte stämma överens med testgruppens subjektiva bedömning då testgruppens bedömning av samma dikter ligger nära medelvärdet. Sambandet mellan mjukvarans bedömning och testgruppens tycks inte följa någon trend för varken ordpoäng eller kontextpoäng.

Att någon form av kontextpoäng utdelades i endast 20% av fallen kan bero på att den genererade kontexten är alltför omfattande och många ord som ingick i kontexten sågs som alltför långsökta i förhållande till de valda temaorden (se Bilaga C). Dock visade det sig att kontextpoäng aldrig delades ut av testgruppen om mjukvaran inte heller hade gett texten i fråga kontextpoäng. Även om mjukvaran ofta lyckades med formuleringarna på enskilda rader enligt testgruppen, så skapade raderna sällan tillsamans en lyckad kombination. Detta beror främst på att raderna genereras för sig och mjukvaran endast tar hänsyn till föregående rad med avseende på rim, och när versmåttet för limerick användes, även på antal stavelser. Om övrigt innehåll i föregående rader även skulle tas med i genereringen av nästa rad kunde det slutliga resultatet förbättras yttligare.

Även om det är svårt att se någon koppling mellan höga ordpoäng från mjukva-ran och höga ordpoäng från testgruppen så kan en relativt jämn poängkurva tyda på att mjukvaran genererar lyckade, poetiska formuleringar. Oväntade och unika ordval ledde till att testgruppen gav högre poäng, vilket är motsatsen till mjuk-varans interna poängsättning, där vanligt förekommande formuleringar har högst poäng.

Korpusbaserade N-gram tillåter en effektiv generering av naturligt språk. Detta bygger dock på att vanligt förekommande ordföljder föredras. En framtida under-sökning skulle kunna implementera ett annat poängsystem där ordföljderna fort-farande bygger på korpusbaserade N-gram men poängsattes utifrån andra kriterier

(24)

än frekvens.

En stor andel av de rader med få stavelser fick en hög poäng av testgruppen jämfört med poängsättningen utförd av mjukvaran. Den objektiva poängsättningen tenderar att vara låg för dessa rader samtidigt som den subjektiva tenderar att vara hög. Det enkla poängsättningsystemet som används kan med stor sannolikhet vara orsaken till att den objektiva poängsättningen ofta är låg för rader med få stavelser då rader med få ord inte tillåts bli tilldelad lika många poäng som en rad med fler ord. Att den subjektiva bedömningen av dessa rader ofta är hög kan bero på att rytmen i raden verkar naturlig då antalet stavelser är lågt.

(25)

Kapitel 5

Slutsats

Resultatet av denna undersökning visar att det är möjligt att generera texter som subjektivt kan bedömas som poesi. Mjukvaran som konstruerades för denna under-sökning lyckades med att generera text som utifrån ett antal subjektiva bedömning-ar kan anses vbedömning-ara poesi. Det går även att generera poesi som kan bedömas som bra poesi. Bra i den bemärkelsen att formuleringarna ansågs originella, överraskande och hade rytm.

Det går inte att med denna undersökning som referens säga att det är möjligt att låta en mjukvara objektivt bedöma poesi på ett sätt som överrensstämmer med en subjektiv bedömning. Eftersom mjukvaran inte besitter förmågan att bedöma sin egen poesi, finnes inget sätt att garantera att de genererade texterna är poetiska.

(26)

[1] Parole Korpus. Göteborgs Universitet, 2009. URL http://spraakbanken.gu. se/swe/resurs/parole.

[2] SALDO. Göteborgs Universitet, 2009. URL http://spraakbanken.gu.se/ swe/resurs/saldo.

[3] Oxford Dictionaries. Oxford University Press., Oxford, England, 2013.

[4] M. Cavnar B., W. och Trenkle J. N-Gram-Based Text Categorization. Environ-mental Research Institute of Michigan, Michigan, USA, 2010.

[5] Lilja E. Svensk Metrik. Nordsteds Akademiska Förlag, Stockholm, Sverige, 2006. [6] Damerau F.J. Indurkhya N. Handbook of natural language processing.

Cam-bridge, CamCam-bridge, UK, 2010.

[7] D. och Martin J. H. Jurafsky. Speech and language processing: An introduction to

natural language processing, Computational linguistics, and speech recognition.

Pearson Higher Education, New Jersey, USA, 2000.

[8] P. Lundström-Holmberg, E. och af Trampe. Elementär Fonetik. Studentlittera-tur, Lund, Sverige, 1987.

(27)

Bilaga A

Fonetisk transkription

Vokal-symbol Exempel Fonetisk text

Konsonant-symbol Exempel

Fonetisk text

A: lam L’A:M B bar B’A:R

A lamm L’AM D bod B’O:D

E: se S’E: 2D bord B’O:2D

E sett S’ET F far F’A:R

E0 natten N’ATE0N G gul G’U:L

I: sil S’I:L H hatt H’AT

I sill S’IL J jul J’U:L

O: bo B’O: K tack T’AK

O bott B’OT L lus L’U:S

U: hus H’U:S 2L sorl S’Å:2L

U hund H’UND M mor M’O:R

Y: myra M"Y:RA N natt N’AT

Y mygga M"YGA 2N barn B’A:2N

Å: gå G’Å: NG tung T’UNG

Å gått G’ÅT P pil P’I:L

Ä: häl H’Ä:L R ros R’O:S

Ä häll H’ÄL S sol S’O:L

Ä3 här H’Ä3R 2S kors K’Å2S

Ä4 herr H’Ä4R SJ skjorta SJÖ2TA

Ö: öga "Ö:GA T till T’IL

Ö löss L’ÖS 2T hårt H’Å:2T

Ö3 öra "Ö3RA TJ kedja TJ"E:DJA

Ö4 förr F’Ö4R V var V’A:R

Tabell A.1: Fonetisk transkription enligt RULSYS-notation

(28)

Genererad poesi - ett urval

B.1

Limerick med ett temaord

1. terrorism som ett taktiskt drag av kärleksroman var ett plus någon bokstav en njutning berömmer

kärlekslängtan gömmer

kärleksförhållande av konvergenskrav

2. ett kärleksförhållande kommer strejk och protester bekommer honom ingenting av

av en familjegrav

gud fruktar vad som ankommer

B.2

Limerick med fem temaord

3. skall väl kunna ta en ny längtan frossar före sadism och dödslängtan för denna cancerform

att kärlekslycka bolagsform utanför karl för sin frihetslängtan

4. kommer döden till en kärleksdikt före sekund kommer en självinsikt och nyttiga men snart

bästa gift en drömstart

svartsjuk sorts tecknare det ser piggt

(29)

B.3. KORSRIM MED ETT TEMAORD 23

B.3

Korsrim med ett temaord

5. uttrycka en intensiv närvaro

som kan värderas hur högt som den betyga och välja samvaro

kärleksdikt rätt att vänta igen

6. fortsätter sina kärleksäventyr med läraren är mindre giltigt kärlek och falsk polityr

helt själv då ska den slutgiltigt

B.4

Korsrim med fem temaord

7. känslomässig mångsidighet inte sexuell prägel förelåg spänd blev hans besatthet avreagera av ett tunnelbanetåg

8. samma kärlekslängtan samma uppflammande varför inte trängtan

(30)

Genererad kontext

C.1

Ett temaord - kärlek

kärlek, syskonkärlek, syskon, svartsjuk, avund, sol-och-vår, bedrägeri, självkärlek, själv, sanningskärlek, sanning, romantisk, platonisk, människokärlek, människa, mo-derskärlek, mor, kärleksäventyr, äventyr, kärleksvisa, visa, kärleksval, val, kärlek-störstande, törsta, kärlekstunnel, tunnel, tivoli, kärleksstrejk, strejk, kärlekssorg, sorg, kärleksrykte, rykte, kärleksroman, roman, kärleksrival, rival, kärleksrelation, relation, kärlekspar, par, kärleksord, ord, kärleksnovell, novell, kärleksnatt, natt, kärleksmöte, möte, kärleksmelankoli, melankoli, kärlekslängtan, längtan, kärleksly-rik, lykärleksly-rik, kärlekslycka, lycka, kärlekskval, kval, kärlekskris, kris, kärlekskrank, läng-ta, kärlekskonflikt, konflikt, kärleksknep, knep, kärleksgärning, gärning, kärleksgu-dinna, gukärleksgu-dinna, kärleksgud, gud, kärleksgnabb, gnabb, kärleksförklaring, förklara, kärleksförhållande, förhållande, kärleksförbindelse, förbindelse, kärleksfull, kärleks-dryck, kärleks-dryck, kärleksdikt, dikt, kärleksbudskap, budskap, kärleksbrev, brev, kärleksbe-tygelse, betyga, kärleksbesvikelse, besvikelse, kärleksberedd, beredd, kärleksbard, bard, poesi, sällskap, älska, killkärlek, homosexuell, hjärtesorg, hjärtekval, föräldrakärlek, förälder, fosterlandskärlek, fosterland, faderskärlek, far, broderskärlek, bror, amorös, tillfällig, venus, eros, amor, afrodite

(31)

C.2. FEM TEMAORD - KÄRLEK, ÄKTENSKAP, KYSS, ROMANS, KÄNSLA 25

C.2

Fem temaord - kärlek, äktenskap, kyss, romans, känsla

References

Related documents

Om lärarna har detta lärandeperspektiv som grund, kan det bidra till eleverna förstå syftet med fysisk aktivitet och på så vis blir mer sporrade och motiverade till att vara

Det saknas inte utrymme eller tid att översätta detta och det kan vara till nytta för hörselskadade utan att det på något sätt stör andra tittare.. Andra sorters annulleringar

I detta avsnitt presenteras forskningsbakgrunden för att kunna utreda hur historieundervisningen ser ut i relation till lärarcentrerad och elevcentrerad

36 Asp, Kent (red.), Den svenska journalistkåren, Institutionen för journalistik och masskommunikation, Göteborgs universitet, Kungälv, 2007,

Hade jag haft med en dur-ters hade det visserligen kunnat skapa associationer till något glatt och positivt, men jag tyckte att det skulle avvika för mycket från tonspråket och

Uppsatsen ämnar undersöka vad som identifieras som beteende som bryter mot heteronormativa genusnormer för tjejer och killar, hur dessa beteenden värderas enligt de

Samtal där texten åsidosätts till förmån för samtal om egna erfarenheter, eller där texten bara är en utgångspunkt för att tala om ämnen som skildras i boken,

Om inte mjukvaran bidrar till den tekniska karaktären kommer bedömningen endast utgå från hur denna mjukvara (oavsett om det är ett textbehandlingsprogram, en