• No results found

Stegvis sammanfogning av chunksegment till större enheter

3 Identifikation av obegränsade primära satsled

19 %Ett primärt finit,

3.4 Stegvis sammanfogning av chunksegment till större enheter

'Vi håller rummen kalla vintertid .'

PN UTR PLU DEF SUB VB PRS AKT NN NEU PLU DEF NOM JJ POS UTR/NEU PLU IND/DEF NOM NN UTR SIN IND NOM MAD

Nom Nom Nom

1 1 2 1

Figur 15 Felaktig sammanfogning sker som här förhållandevis sällan p.g.a. rangerna.

(ja12-024)

3.4 Stegvis sammanfogning av chunksegment till större enheter

Efter den rangbaserade chunkningen sker en stegvis sammanfogning av dessa segment till allt större enheter med syftet att möta ett antal primära nominala led som är kompatibelt med den aktuella sats- eller verbfrasstrukturens behov, utgå-ende bl.a. från dess valens. I dessa steg sammanfogas också primära adverbiella led av ett antal som är okänt och teoretiskt sett obegränsat. Typerna av segment som skapas är också fler än de som är resultatet från den rangbaserade chunk-ningen, eftersom den stegvisa sammanfogningen skapar komplexa typer som bisatsled och infinitivfraser. Dessutom har detta steg syftet att fästa efterställda attribut till föregående segment. Målet är att de segmenttyper som i Telemans uppställning kan ha nominal roll (enligt Tabell 17) och dessutom adverbiella segment ska identifieras, för att utgöra kandidater i den funktionella rolltilldel-ningen, enligt Figur 7. I många fall är redan resultatet från den rangbaserade chunkningen tillräckligt och inga fler sammanfogningar sker. Men komplexare enheter bestående av flera potentiellt obegränsade strukturer som infinitivfraser

och bisatser skapas t.ex. genom dessa sammanfogningsprocedurer. Viss annan information om möjlig adverbialfunktion hos NP, troligt huvudord etc. läggs också till.

Den stegvisa utökningen av chunksegmenten till större enheter är en del av den-na metod, som består främst av sammanlänkning av två eller flera chunkar på grundval av två angränsande ordtyper och/eller ordklassinformation. Detta är också ett steg där sådana möjliga sammanlänkningar ibland inte bör ske p.g.a. att satsen kräver att ett av leden ska inleda en ny chunk. Det är alltså ett av de lägen där möjlig strukturell ambiguitet som felkälla tydligt uppenbaras och i princip kan hindras.

3.4.1 Framförställda attributslag

Sammanlänkning av ytterligare framförställda attribut sker genom olika sam-manlänkningsregler. De följande är typiska exempel.

 Sammanfogning av framförställda adverbattribut till prepositionsfraser krävs eftersom adverb har rangen 3 och prepositioner 15, vilket visas i Figur 16.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

- Nu väntar vår lunch , sa maken , och direkt efter den far vi till lägret .

MID AB VB PRS AKT PS UTR SIN DEF NN UTR SIN IND NOM MID VB PRT AKT NN UTR SIN DEF NOM MIDKN AB POS PP PN UTR SIN DEF SUB/OBJ VB PRS AKT PN UTR PLU DEF SUB PP NN NEU SIN DEF NOM MAD PP Nom PP Nom PP

PP PP Nom PP Nom Adv PP Nom PP Nom Nom Nom Nom PP Nom PP

MI 3 VB 4 1 MI 1.5 3 15 1 1 15 1

Figur 16 Sammanfogning av framförställda attribut sker här exempelvis med en regel

’di-rekt + preposition’ (di’di-rekt efter den) i det tredje steget (lagret) av sammanfogningar.

Ovanstående exempel betraktas dessutom som felaktig analys, anföringen fortsätter efter

”sa maken”. Sa borde tolkas som det enda primära finitet. (kn05-074)

 Vissa kvantifikatorer och mängdord har enligt rangmetoden inte länkats samman med följande delar. En anledning till detta är, som redan nämnts, att skjuta upp somliga beslut om hopslagning till senare i analysen då antalet tillgängliga led kan jämföras för matchning med verbställighet och möjliga komplementslag. Speciella kvantifikatorer som halva (adjektiv) kan föregå t.ex. determinator, halva/2 den/5 stora vägen.

3.4.2 Efterställda attributslag

 Sammanfogning av efterställda PP-attribut på grundval av valens hos sub-stantiv/adjektiv/particip i NP/PP utgående från valensdata från NEO, Lexin eller egna tillagda länkningar: ackvisition – för, härskare – över, protest –

mot.

 Sammanfogning av efterställda relativbisatser till föregående struktur. En kvantitativt försvarbar (men långt ifrån undantagslös) tumregel är att på-hängda relativbisatser och andra bisatser inte efterföljs av andra primära

obegränsade led i samma satsfält. Detta exemplifieras i Figur 17. En

liknan-de strategi för infinitivfraser visas i Figur 18.

1 2 3 4 5 6 7 8 9 10 11 12

Forskningssociologer säger dock att något annat förlopp knappast hade varit tänkbart .

NN UTR PLU IND NOM VB PRS AKT AB SN DT NEU SIN IND JJ POS NEU SIN IND NOM NN NEU SIN IND NOM AB SUV VB PRT AKT VB SUP AKT AB POS MAD Nom Nom Nom Nom

Nom Nom Nom Adv Adv Adv Adv Nom Nom Nom

1 10 5 2 1 3 VB VB 3

Figur 17 Sammanlänkning av hela att-satsen sker till nästa begränsade primära led

(fc01-090). De olika etiketterna Nom och Adv är defaultvärden som har mindre bety-delse, speciellt för de lägre segmenteringsnivåerna. Nästa avsnitt redogör för hur de tre skikten av segment, under texten och ovanför det nedersta (rangchunkningsresultatet), skapas.

1 2 3 4 5 6 7 8 9

Kvinnan framför spisen läste utan att titta upp .

NN UTR SIN DEF NOM PP NN UTR SIN DEF NOM VB PRT AKT PP IE VB INF AKT PLMAD Nom Adv Nom Adv Adv Adv Nom Adv Adv Adv Adv Nom Adv Adv

1 15 1 15 11 VB PL

Figur 18 Satsförkortningstypen infinitivfras sammanfogas på samma sätt som i Figur 17.

3.4.3 Tre lager av sammanfogningsregler

För att skapa denna funktionalitet som slår samman närliggande chunkar har ett kontinuerligt testande pågått med träningsmängden för att finna så många exem-pel som möjligt, varifrån reglerna, som är uttryckta så generellt som möjligt för att täcka ett visst fall, hämtats.55 Sammanfogningen sker som syns i exemplen organiserat stegvis i tre skikt. Denna uppdelning möjliggör att finna felaktighe-ter och knyta dem till en specifik sammanfogningsprocess. De tre stegen har bara detta syfte och det har inte någon speciell betydelse vad som sker i vilket steg.56 Framförallt ska det påpekas att sammanfogningen av segment inte mot-svarar en konstituentstruktur eller liknande.

Strukturnivå 1

På strukturnivå 1 skapas utöver segmenten som kommer från den rangbaserade chunkningen egna chunkar för begränsade led, licensierade begränsade led, bi-satsinledare, interpunktionstecken och interjektioner. I princip ska alla grafiska ord utom de identifierade primära begränsade leden, inklusive förfält, ingå i nå-gon chunk under segmenteringen.

Strukturnivå 2

Sammanfogning av chunkar till större chunkar i strukturnivå 1 på grundval av:

– Ingående bisatser (inklusive relativbisatser) som har bisatsinledare eller saknar bisatsinledare (p.g.a. som-strykning) enligt föregående avsnitt

– Ingående infinitivfraser

– Ingående valensmatchning för substantiv och adjektiv/particip med PP

55 Rent implementationstekniskt sparas s-enheter som exempel tillsammans med kommentar och flera exempel kan därmed jämföras för att skapa så exakta matchningsregler som möjligt senare (se Kapitel 4). Funktionalitet för att spara exempelenheter har allmänt använts mycket i implementationen, bl.a. för att spara enheter där feltaggning i SUC misstänks.

56 En möjlig konsekvens av vilken ordning som stegen sker i är dock att om stora sjok sam-manfogas tidigt i processen så kommer mindre parvisa sammanfogningar p.g.a. attributvalens och liknande att behöva ske mer sällan, eftersom de nedan ingår i sådana större strukturer.

Bisatser och infinitivfraser

Bisatser, inklusive relativbisatser, och infinitivfraser har naturligt en underord-nad roll i huvudsatsanalysen eftersom de ingår i eller utgör egna primära satsled, men sällan behöver skärskådas i fråga om beståndsdelar för huvudsatsanalysens skull. I fall av utbrutna satsled, satsflätor etc., är det egentligen nödvändigt med denna analys av underordnade konstituenter för kunna etikettera led rätt. Denna aspekt har visat sig möjlig att bortse från i huvudsatsanalysen om målsättningen är att nå hög procent korrekta analyser, varifrån undantag senare kan särbehand-las, snarare än att den utgör en perfekt regelsamling/grammatikbeskrivning från början. Bisatser, inklusive relativsatser, och infinitivfraser har visat sig ofta un-derkasta sig följande enkla, men långt ifrån undantagslösa, heuristiska regel i parsningen.

 En inledd bisats eller infinitivfras tenderar att låta det primära led det utgör eller ingår i att fortsätta fram till nästa primära begränsade led (verb, partikel, reflexiva pronomen, korta adverbial) eller slutet på det primära fältet/den ak-tuella huvudsatsen. D.v.s: när ett obegränsat led (nominalt eller adverbiellt) innehåller (ev. relativ) eller är bisats eller infinitivfras, förväntas detta primä-ra led att inte efterföljas direkt av ett annat primärt obegränsat satsled. Ex 41 visar några faktiska undantag från denna regel.

Ex 41 a) Under den pågående vattenfestivalen är, som vi tidigare berättat, också

ko-operationen engagerad. (som/HA-adverbial följt av subjekt etc.) (he07c-002) b) Ingen kan veta vad jag drömmer, även om vi med EKG kan sluta oss till att jag drömmer. (vad/HP-sats följd av subjunktionsinledd bisats) (gb10-041) Att kunna undvika att för långt segment ses som del av inledd bisats är ibland en svårare uppgift. I Ex 41 finns ledtrådar i a) genom att om tolkningen är att som-satsen sträcker sig ända till slutet så saknas subjekt och objekt. I b) krävs inga fler led om vad-satsen skulle fortsätta till slutet. En tendens är dock att subjunk-tionsinledd bisats (även om) är ’starkare’ än relativsatser och därför blir ett nytt primärt led trots inledd underordnad sats. Dessa undantagsfall täcks inte riktigt bra ännu.

Strukturnivå 3

Sammanfogning av chunkar från strukturnivå 2 till större chunkar på grundval av:

– En stor samling av heuristiska regler som för samman chunkar p.g.a. deras in-nehåll, starter, avslut och ingående ord och ordklassinformation. Skapandet av olika länkningsregler kan ofta ske direkt i gränssnittet. Möjligheten att införa ord

i speciella grupper direkt vid en påträffad förekomst i speciell textmening inne-bär att samma s-enhet direkt kan testas efteråt. Ofta är en sådan ordkategorise-ring, t.ex. tillägg av mängdord, och inte nya allmänna syntaktiska regler, vad som krävs för korrekt syntaxanalys.

Dessutom sker sammanfogning på grundval av:

– Identifikation av parentesuttryck

– Prepositioner med speciella rektioner (bisatser och infinitivfraser) – Konjunktioner i slutet av segment