• No results found

Identifikation av primära konjunktioner

2 Identifikation av begränsade primära satsled

2.6 Identifikation av primära konjunktioner

Som primära konjunktioner räknas de konjunktioner, kommatecken, tankstreck, kolon etc. som samordnar primära satser och primära verbfraser. Den första gruppen är sådana som samordnar huvudsatser (Ex 26 a och b) och primära

fini-ta verbfraser (Ex 26 c och d). Grundregeln är som nämnts att varje primärt finit

verb ska vara ensamt i sin huvudsats/primära finita verbfras. Mellan dessa två konjunkttyper finns bara skillnaden att huvudsatser generellt har fundament och oftast ett subjekt. Det är därmed placeringen av den primära konjunktionen och den uppdelning som sker som avgör om konjunkten är huvudsats eller finit verb-fras. Den efterföljande identifikationen av de obegränsade leden (se Kapitel 3) sker i det område som avgränsas av de primära konjunkterna, och förfält när så-dana finns.

Ex 26 a) Det är sällan några minnesvärda matcher så jag kommer inte ihåg dem men

jag stirrar i alla fall. (kr01c-006)

b) Den startade sannolikt ca 1905-1910 men modellernas och konstruktionernas inbördes kronologiska ordning är långt ifrån utredd. (ea21-095) c) Den vita katten med violblå ögon tryckte sig mot dörren och hoppades förgä-ves på att bli insläppt i stugvärmen. (kk03-092) d) Han granskar förhörsprotokollen och ställer sig överhuvudtaget kritisk till

hela rättegångsförfarandet. (ga06-087)

6 602 av 40 000, dvs. ca 16,5 % slumpvis analyserade s-enheter var markerade av

syntaxanalysatorn som innehållande minst en primär konjunktion.

Frekvensuppskattning 10 Förekomsten av primära konjunktioner beräknas till 16,5 %.

Jäm-för Diagram 7 om frekvens Jäm-för s-enheter med olika antal primära finita verb.

Identikation av primära konjunktioner görs genom att tilldela konjunktioner mellan två primära finit olika poäng beroende på kontext och position, även själva ordet, t.ex satssamordnaren ty, som särskiljs bidrar till poängen. Identifi-kationssäkerheten för primära konjunktioner testades genom att söka efter 100 s-enheter, i testmängden ur SUC, med minst en utsatt primär konjunktion. Av 100 enheter som markerats innehålla mer än en huvudsats/primär finit VP var en klar majoritet av valen enkla p.g.a. att bara en kandidat för primär konjunktion fanns. Fem enheter antogs vara felanalyserade så att t.ex. en finitlicensiering (t.ex.

som-strykning) missats och det blev därmed inte fråga om en här eftersökt

sam-ordning. Fyra enheter antogs blivit fel p.g.a. fel taggning i SUC, vilket bl.a. in-neburit att egentlig licensierare (t.ex. som, där) hade en taggning som icke-bisatsinledare. I 17 av s-enheterna fanns det intressanta läget att mer än en tydlig kandidat till primärkonjunktion förekom, och i 14 av dessa valdes den rätta samordnaren av systemet vid detta tillfälle.

Ex 27 a) Även om motståndarlaget är starkt skall vi kunna behålla vårt eget system och inte behöva virra till det med panikåtgärder. (eb04a-062) b) Formspråket har på det senaste året reducerats än mer och stramats upp.

(cc03d-027) c) Hela förra vintern hade han arbetat tillsammans med Alvar Yxberg och kört hästforor mellan Hudiksvall och Norge. (kn01-118) En annan konjunktionstyp som identifieras är den som samordnar primära

icke-finita verbfraser, enligt Ex 27. Denna primära konjunktionstyp är enkel att

iden-tifiera korrekt. Metoden innebär helt enkelt att välja den konjunktion som när-mast föregår. Det har varit svårt att hitta undantag här, även om ett adverbial som innehåller konjunktion som i Han ska skotta och till och med grusa exemp-lifierar denna möjlighet.

2.7 Identifikation av förfält

Före fundamentpositionen finns plats för en inledande del som saknar direkt funktionell roll i den påföljande satsen, även om den inte kan kallas betydelselös och i Ex 29 nedan introducerar ämne. Denna sekvens är oftast en konjunktion men den har i vissa fall ett betydligt mer svårfångat mönster. Dessa segment är egentligen inte begränsade i längd men avgränsande i likhet med de primära led

som beskrivs i detta kapitel. Eftersom denna ansats har praktiska syften tolkas parenteser och talstreck delvis också som förfältsinnehåll, se vidare nedan.

Ex 28 a) Och därför är, vilket världen känner till, vår litterära kultur världens främsta. (ja21-069) b) Men det är faktiskt en chimär. (gb18-082) c) (Detta gäller vid låga energier, c:a 1 MeV. (fh10-074) Ex 28 exemplifierar de vanligaste typerna av förfältsinnehåll. De är frekventa och relativt lätta att identifiera genom matchning i områdena direkt i textme-ningens start eller i området omedelbart före det primära finita verbet. Fallen i Ex 29 tas istället företrädesvis hand om genom en matchning av själva funda-mentledet. Förfältsinnehåll går under namn som initialt annex i SAG (Teleman, Hellberg och Andersson 1999) respektive fria fundament eller initialt

extrapo-nerade led i Andersson (1994).

Utvidgad sats

Förfält Initialfält Inre sats Efterfält

(Fundament) Mittfält Slutfält

Imorgon, kan hon nog vara med, din syster.

Tabell 16 Beskrivningen av den utökade satsen enligt SAG (4:6) inbegriper fältpositioner för

initiala och postponerarade annex i efterfält. Huvudfokus för arbetet är ’den inre satsen’. Den utökade satsbeskrivningen används kanske framförallt i talspråksanalys.

Ex 29 a) "Hejsan Nisse, jag skulle behöva låna en halv miljon." (kr05-071) b) Hon med sin rikssvenska sörmländska och han med sin nordskånska skorr-ning - jag minns knappt att de talade med varann. (fc05-135) c) - Mycket intressant, herr Selander, men den här turen tar lång tid.

(kn06-106) Ex 29 a) och b) illustrerar att ’avgränsare – personligt pronomen – primärt finit verb’ i en del lägen skiljer huvudsatsens fundament från en tidigare sekvens (här motsvarar denna sekvens den kommande bisatsens subjekt, men räknas inte som del av satsen syntaktiskt). Det ovanligare fallet i Ex 29 c) verka kräva en sorts igenkänning av den bestämda nominalfrasen den här turen för att kunna utesluta föregående segment.

3 525 av 40 000, dvs. ca 8,8 % slumpvis analyserade s-enheter var markerade av

syntaxanalysatorn som innehållande förfältsmarkerade ord/tecken.

Frekvensuppskattning 11 Förfältsidentifikation som avgränsar framåt i s-enheter markeras i

8,8 % av s-enheterna.

Förfält identifieras dels genom matchning, så att vissa inledande konjunktioner och vissa sekvenser inte hamnar i fundament eller på primärfinits position. Dessutom används en s.k. negativ definition där istället själva fundamentet mat-chas och den föregående resten, utan djupare analys, tolkas som placerat i förfäl-tet. Ex 29 a) visar ett fall som analyseras korrekt genom att pronomen med sub-jektskasus mellan kommatecken och primärfinit tolkas som ensamt subjekt. Pro-grammet identifierar generellt talstreck och parentesstart som förfältsinnehåll, däremot inte citattecken eller talstreck (eller liknande streck) som föregår ytt-rande i s-enhet med direkt anföring med angiven yttrare - Det var bra, sa han. Hur väl fungerar den beskrivna metoden, och hur ser fördelningen av faktiska förfältssegment ut i svensk publicerad text? En mindre undersökning genomför-des också för att ge en bild av korrektheten (närmare bestämt precisionen) av förfältsidentifikationen samt hur de olika förfältsinnehållen fördelades formmäs-sigt. En sökning gjordes efter 100 framslumpade s-enheter med förfältsinnehåll – uppenbart kan av programmet inte identifierade förfält ha missats. Erfaren-hetsmässigt är de som missats att identifieras långa led, eller kombinationer av typiska förfältare. Av de 100 markerade enheterna betraktades tre som felanaly-serade förfält. De övriga fördelade sig enligt Diagram 8.

Diagram 8 Av de 97 av 100 korrekta uppmärkningarna utgjordes majoriteten av ettords- eller

etteckenuttryck. Konjunktionen Men (ensamt) är det vanligaste ordet som fungerar som för-fältare. Kategorin Långa innehåller kombinationer av uttryck som interjektion – komma och fria annex som Stundtals faktiskt hejdlöst rolig: aldrig har väl […]. Talstreck innebär inte nödvändigtvis ett typografiskt långt eller speciellt markerat tecken. 33 av de markerade s-enheterna här gäller teckenformade segment i stället för ord.

Talstreck Men Och Långa Interj Eller Parentes Stjärna Så (Konj) För (Konj)

Antal förekomster av 100 31 28 16 14 2 2 1 1 1 1 0 5 10 15 20 25 30 35 An ta l f öre ko m st er

Sammanfattningsvis kan sägas om identifikationen av de primära begränsade satsleden i satsschemat att kandidater till dessa generellt kan samlas in enkelt genom ord- och taggningsinformation medan licensieringsprocesserna inte rik-tigt hundraprocenrik-tigt identifierar varje förekomst som primär eller syntaktiskt underordnad.