fredag den 19. februar 2021

Diskussion af eTranslation til brug i danske virksomheder - Claus Thornby Larsen

 

Claus Thornby Larsen er Language Technology Coordinator  Europa-Kommissionen, Generaldirektoratet for Oversættelse.

Claus har skrevet en artikel om eTranslation i brancheorganisationen  SMVdanmarks nyhedsbrev. Det er den korte version af den oprindelige artikel. 

Den fulde tekst kan læses her:

Diskussion af eTranslation til brug i danske virksomheder - Claus Thornby Larsen

Europa-Kommissionen har verdens største offentlige oversættelsestjeneste, som hedder Generaldirektoratet for Oversættelse (DGT). Vi oversætter over 2 mio sider om året til de 24 officielle sprog. Det meste er lovgivning, men der er også rapporter, korrespondance og webindhold.

 

Der har i 20 år eksisteret maskinoversættelse i DG Translation - i den tidlige fase var det regel-baseret maskinoversættelse. Det dækkede dog kun de store sprog, og kvaliteten var ikke imponerende. I 2012 etablerede DGT en lille afdeling for maskinoversættelse. Der blev udviklet statistikbaseret MT - hvilket var inspireret af Google Translate. Vores oversættere må ikke benytte Google, da de beholder de uploadede tekster. Vi havde derfor brug for vores eget system. For dansk sprogs vedkommende fungerede vores eget statistiskbaserede maskinoversættelse, kaldet "MT@EC" rimeligt, men der skulle rettes megen grammatik og ordstilling. Fra 2018 skiftede systemet navn til eTranslation, og begyndte at levere neural maskinoversættelse. Det har hævet kvaliteten markant.

 

Vores maskiner trænes jævnligt med vores egne data, og da vi råder over en database med al oversat tekst tilbage fra midten af 1990'erne, har vores eTranslation Team i teorien 1 mia. segmenter af god kvalitetsoversætteskvalitet at træne med. Efter større investeringer fra DG Connect er kapaciteten blevet udvidet, og hvor det tidligere kun var offentlige myndigheder og videeregående uddannelsesinstitutioner, som kunne få adgang til eTranslation, er kredsen nu udvidet til små og mellemstore virksomheder i EU. Det kræver blot, at man lader sig registrere. De tekster der bliver sendt til eTranslation bliver ikke lagret - og der gemmes heller ingen personoplysninger. Vi beholder kun statistik om antal dokumenter og sider, der er sendt til oversættelse.

 

Med den udvidede adgang for SMV'er ønsker Kommissionen at stille et sikkert system til rådighed, som også dækker de mindre EU-sprog, herunder dansk. På den måde kan SMV’er få hjælp til at overvinde sproglige barrierer, når de opererer på det indre marked.

 

Der er den seneste tid blevet sat turbo på udviklingen af Kommissionens eTranslation, bl.a. er der tilføjet en maskine, som skal trænes med ikke-EU-tekst (general language). Der er også (begrænsede) muligheder for at tilføje domænespecifikke maskiner. Fx har eTranslation-teamet for nylig udviklet en maskine til det finske statsministerium, som er trænet med relevant materiale.



 

Ingen kommentarer:

Send en kommentar