• No results found

Den korpus- eller frekvensorienterade inriktningen

In document Strängt upptagen och fast besluten (Page 45-48)

3. Kollokationer: forskningsbakgrund

3.1. Vad är en kollokation?

3.1.1. Den korpus- eller frekvensorienterade inriktningen

Firth var föregångare inom den korpus- eller frekvensorienterade

forsk-ningsinriktningen. Hans efterföljare är kontextualister, dvs. de ägnar sig

åt kvantitativ analys av stora mängder datalagrad text. Enligt Butler (1985:7) intresserade sig Firth endast för frekvent samförekomst av vad han kallade ”mutually predicting lexical items” (som t.ex. dark + night) medan hans efterföljare, t.ex. Halliday och Sinclair, ökar räckvidden för termen kollokation och låter den täcka samförekomst av alla typer av ord. Definitionen skulle kunna lyda ungefär ”samförekomst av lexikala enheter” (Bahns 1996:1). Den korpus- eller frekvensorienterade teorin har fått störst genomslag i England där den utvecklades, men tillämpas också av forskare från andra länder.

3.1.1.1. Halliday

Den tendens till samförekomst som föreligger mellan lexikala enheter, t.ex. mellan orden sit, chair och comfortable, ser Halliday et al. (1964:33) som ”the basic formal pattern into which lexical items enter”, vilket i princip utgör hans definition av termen kollokation. Halliday (1966:158) använder termen nod (eng. node) för det ord som undersöks i en korpus och kollokat (eng. collocate) för de ord som samvarierar med noden. Dessa termer har blivit gängse inom den korpus- eller frekvens-orienterade inriktningen. En lista över kollokat som samvarierar med en viss nod kallar Halliday för kluster (eng. cluster). Ett kluster innefattar såväl sällan förekommande som ytterst frekventa kollokat. Halliday et al. (1964:33) intresserar sig för att få fram lexical sets, dvs. ”a grouping of items which have a similar range of collocation”.

3.1.1.2. Sinclair

John Sinclair fortsätter Firths arbete med att utarbeta en teori för den lexikala nivån. Han menar att det är svårare att uttala sig om vilka mönster som lexikala enheter ingår i än att uttala sig om grammatiska enheter eftersom ”lexical items do not contrast with each other in the same sense as grammatical classes contrast” (Sinclair 1966:411). Han menar att en stor mängd exempel behövs för att man kunna uttala sig om lexikala mönster. Kollokationsanalysen är därmed beroende av ”a very large computer” (Sinclair 1966:410). Den tekniska utvecklingen har på senare tid möjliggjort korpusundersökningar av en storlek som nog ingen kunde föreställa sig år 1966. Ett exempel är COBUILD-korpusen som utarbetats under ledning av Sinclair. Den omfattade 200 miljoner ord redan år 1992 och har fortsatt att växa sedan dess (Bahns 1996:12).

Sinclair (1966:424) visar att man med hjälp av kollokationer kan identifiera ordklasser lexikalt, utan hjälp av grammatiken. Då han un-dersöker mat, som i engelskan kan vara antingen substantiv, adjektiv eller verb, kan han skilja ordklasserna från varandra med hjälp av kon-texten. Mat som substantiv (sv. matta) kollokerar med door, wipe, hall etc., mat som adjektiv (sv. matt) kollokerar med paint, finish, surface etc. och mat som verb (sv. tova ihop sig) med ord som hair, jam och

thick. Denna metod har gjort det möjligt att inom korpuslingvistiken göra

semantiska analyser av korpusar med hjälp av datorer. En grov indelning i ord, ordklasser och betydelsenyanser kan göras automatiskt med hjälp av kontexten. Detta används bl.a. vid lexikografiskt arbete.

Sinclair skiljer på casual och significant collocation. Casual

collo-cation kan avse vilken samförekomst som helst, medan significant col-location ”is regular colcol-location between items, such that they co-occur

more often than their respective frequencies and the length of text in which they appear would predict” (Jones & Sinclair 1974:19). Huruvida sambandet mellan ord A och ord B är ”signifikant” eller inte avgörs ge-nom statistiska beräkningar (ibid.). Sinclair (1966:414) uppmärksammar också det faktum att en nod och dess kollokat inte behöver stå intill varandra i en text. Att ordet pillar-box ofta befinner sig alldeles intill noden post i texter medan ordet letter ofta har något ord mellan sig och det undersökta ordet post betyder inte att förbindelsen pillar-box / post har en fastare anknytning än förbindelsen letter / post. Sinclair (1966:415) inför termen span (eller collocational span) för avståndet mellan nod och kollokat. Han konstaterar att det inte går att fastställa exakt hur stort kollokationsspannet bör vara. Det får avgöras speciellt för

varje undersökning med tanke på undersökningens syfte, korpusens storlek och sammansättning m.m.

Sinclair (1966:429) framhåller också hur viktigt texturvalet är för un-dersökningsresultatet. Många kollokationer förekommer bara i vissa texttyper och om inte de typerna är representerade i korpusen uteblir kollokationerna från resultatet (ibid.).

3.1.1.3. Andra korpus- eller frekvensorienterade forskare

För Halliday och Sinclair är kravet på en kollokation alltså att de ingå-ende orden, nod och kollokat, förekommer tillsammans i en korpus inom ett visst, för den aktuella studien specificerat, kollokationsspann. Fler forskare, som t.ex. Lehr (1996) och Svanlund (2001), använder termen

kollokation med denna betydelse. Exempel på kollokat till ordet vikt som

listas hos Svanlund (2001:Appendix B) är av, att, stor, vid, understryka och största. Såväl av vikt som vikt av är exempel på kollokationer eftersom av förekommer både före och efter ordet vikt inom det kollokationsspann på 5:5 (dvs. 5 ord till vänster och fem ord till höger) som Svanlund har valt. Kollokationernas frekvens är naturligtvis viktig vid kvantitativa studier. Svanlund (2001:107) har listat kollokaten till de undersökta noderna i frekvensordning och han inkluderar endast kollokationer med minst tre samförekomster eftersom ”endast åter-kommande ordkombinationer [är] av intresse”.

Några forskare lägger till frekvenskravet i sin kollokationsdefinition. Nod och kollokat ska förekomma tillsammans i en korpus med märkbart högre frekvens än vad slumpen skulle medföra för att de tillsammans ska utgöra en kollokation. Termen används då liktydigt med Sinclairs

significant collocation (se föregående avsnitt). Ibland krävs utöver

fre-kvent samförekomst också att ordsammanställningarna ska vara gram-matiskt välformulerade (Allén et al. 1975, Kjellmer 1996, Atkins & Rundell 2008). Enligt Atkins och Rundell (2008:369) ska ett kollokat ”stand in a major grammatical relationship to the [node]”. Som exempel anger de bl.a. ett substantiviskt objekt till ett verb, t.ex. relationship,

bonds och alliance som objekt till verbet forge. Kjellmer (1996:79) ger

följande exempel på svenska kollokationer: en ljus framtid, goda

In document Strängt upptagen och fast besluten (Page 45-48)