• No results found

Hur kan informationsystem fås att söka på flera språk?

N/A
N/A
Protected

Academic year: 2021

Share "Hur kan informationsystem fås att söka på flera språk?"

Copied!
2
0
0

Loading.... (view fulltext now)

Full text

(1)

Hur kan informationsystem f˚

as att s¨

oka efter

information p˚

a flera spr˚

ak?

Jussi Karlgren

30 januari 2001

Idag ska jag prata om hur s¨oksystem och s¨okmotorer kan f˚as att arbeta med texter och dokument p˚a flera spr˚ak. Det blir fler och fler dokument elektroniskt tillg¨angliga p˚a fler och fler spr˚ak – fr˚an att materialet p˚a internet och i informa-tionsteknologiska sammanhang i allm¨anhet varit uteslutande p˚a engelska g˚ar vi mot en textsamling, ett digitalt bibliotek, som b¨attre avspeglar den flerspr˚akiga v¨arld vi lever i. Och det icke-engelska materialet v¨axer snabbare i storlek ¨an det engelska. F¨orutom svenska och engelska som b˚ada redan har sin plats i svensk informationsvardag kommer EU-samarbetet och ¨Ostersj¨o-samarbetet f¨ora in fler spr˚ak f¨or oss att l¨asa p˚a.

Men det betyder inte att allt material ¨ar lika synligt, ¨aven om det till-g¨angligg¨ors p˚a liknande s¨att. De flesta s¨okningar som g¨ors p˚a internet fr˚an svenska datorer g¨ors p˚a engelska: l¨asarna tror de f˚ar fler eller b¨attre tr¨affar p˚a det s¨attet. Det ¨ar f¨orst˚as en sj¨alvuppfyllande f¨oruts¨agelse. S˚a d¨ar borde vi hj¨alpa till, genom att bygga maskineri som klarar flera spr˚ak.

De system som finns ¨ar oftast enspr˚akiga: f¨orment spr˚akoberoende teknik men konstruerade fr˚an b¨orjan och fortsatt trimmade f¨or att hantera engel-ska spr˚akliga egenheter – s¨arskrivna sammans¨attningar, futtig forml¨ara och fix ordf¨oljd. De ¨ar inte ¨agnade att hantera ryska, latin och svenska med samma kompetens. Det g˚ar dock att ordna med b¨attre algoritmer f¨or texttr¨oskning, och det ¨ar vi flera som jobbar p˚a.

Det ¨ar sv˚art att fr˚aga p˚a ett fr¨ammande spr˚ak. Men det beh¨over inte vara ett problem. Att f˚a ett system att ¨overs¨atta en s¨okfr˚aga till flera spr˚ak ¨ar inte alls tekniskt om¨ojligt. System som relaterar “fiskm˚as” till “seagull” och “larus” (likv¨al som till svenska n¨araliggande termer som “trut” och “t¨arna”!) finns i laboratorierna.

Viktigare ¨ar att sj¨alva gr¨anssnittet inte st¨odjer flerspr˚akighet. Systemen numera brukar till˚ata anv¨andaren v¨alja ett spr˚ak. De flesta svenskar l¨aser g¨arna svenska, utan st¨orre besv¨ar engelska, stavar sig om det ¨ar n¨odv¨andigt igenom danska och norska, och om det ¨ar riktigt viktigt kan de dra sig till minnes n˚at ur skoltyskan eller skolfranskan. Hur ska ett gr¨anssnitt som f¨orklarar det d¨ar se ut? Hur ska l¨asaren tala om f¨or systemet vilka spr˚ak som ¨ar acceptabla? Det ¨

ar inte sv˚art, men m˚aste ordnas.

Men det knivigaste ¨ar nog att hj¨alpa l¨asaren avg¨ora om texten ¨ar bra om

(2)

den ¨ar skriven p˚a ett fr¨ammande spr˚ak. Det f¨orsta man som l¨asare p˚a ett fr¨ammande spr˚ak f¨orlorar ¨ar m¨ojligheten att se om en text ¨ar trov¨ardig och tillf¨orlitlig. Det beh¨ovs bed¨omningshj¨alp: system som hj¨alper en fatta beslut om texten ¨ar l¨asv¨ard eller inte. P˚a vilka grunder? Det ¨ar en forskningsfr˚aga. Men vi vet v¨aldigt lite om hur folk fattar l¨asbeslut sj¨alv, ens enspr˚akigt.

S˚a s¨oksystem f¨or flera spr˚ak m˚aste

• underst¨odja interaktion med texter p˚a flera spr˚ak,

• hj¨alpa och uppmuntra formulera s¨okfr˚agor p˚a flera spr˚ak med avstamp i ett,

• kunna s¨oka i andra spr˚ak ¨an engelska, och

• hj¨alpa folk l¨asa och bed¨oma texter p˚a andra spr˚ak.

Allt det d¨ar ¨ar n¨odv¨andigt – och kommer inte bara att ge oss flerspr˚akiga s¨oksystem utan ¨aven b¨attre enspr˚akiga s˚adana. Och om inte vi i sm˚a spr˚ ak-omr˚aden tar initiativet i att utveckla system av det h¨ar slaget kommer resultatet helt s¨akert inte vara till v˚ar f¨ordel!

References

Related documents

F¨orklara vad som h¨ander med priset p˚ a tillg˚ angar (s˚ asom dina obligationer) och d¨armed den l˚ anga r¨antan i ekonomin.. Varje sysselsatt person producerar varor till

(b) Grekland har ett budgetunderskott p˚ a 13 procent av BNP, dvs att staten spenderar v¨asentligt mer pengar ¨an den f˚ ar in, och m˚ aste l˚ ana resten fr˚ an finansiella

Från nästa år inför vi hepatit B- vaccinering för alla barn i Blekinge och som en del i det allmänna och nuvarande vaccinationsprogrammet för barn.. Satsningen ger en merkostnad

Umeå kommun anser att det är viktigt att överbrygga de geografiska avstånden så att språkcentrum effektivt kan bidra till att stärka de samiska språken över hela området,

Den 24 februari höll den nyvalda nationalförsamlingen – landets lagstiftande församling - sitt första möte för att konstituera sig, välja talman, välja ledamöter och ordförande

Kuba får fler besökare, inklusive en uppgång på 20 procent för US-amerikaner, men turistinkomsterna har inte hämtat sig från nedgången under finanskrisen..

L2: - Ja, kanske det? Det blir lite mjukare. Det kanske skulle locka fler. Andra saker som ofta påverkar eleverna är ju att dem väljer som sina syskon. L1: - Ja, det stämmer, eller

stödmaterialet ”Flera språk i förskolan” (Skolverket, 2013). Detta visar att staten tycker att det är ett viktigt och växande ämne. Dock räcker det inte med en publikation