Claus Thornby Larsen er Language Technology
Coordinator Europa-Kommissionen, Generaldirektoratet for Oversættelse.
Claus
har skrevet en artikel om eTranslation i brancheorganisationen SMVdanmarks
nyhedsbrev. Det er den korte version af den oprindelige artikel.
Den fulde tekst kan læses her:
Diskussion af eTranslation til brug i danske virksomheder - Claus Thornby Larsen
Europa-Kommissionen har verdens største offentlige
oversættelsestjeneste, som hedder Generaldirektoratet for Oversættelse (DGT).
Vi oversætter over 2 mio sider om året til de 24 officielle sprog. Det meste er
lovgivning, men der er også rapporter, korrespondance og webindhold.
Der har i 20 år eksisteret maskinoversættelse i DG
Translation - i den tidlige fase var det regel-baseret maskinoversættelse. Det
dækkede dog kun de store sprog, og kvaliteten var ikke imponerende. I 2012
etablerede DGT en lille afdeling for maskinoversættelse. Der blev udviklet
statistikbaseret MT - hvilket var inspireret af Google Translate. Vores
oversættere må ikke benytte Google, da de beholder de uploadede tekster. Vi havde
derfor brug for vores eget system. For dansk sprogs vedkommende fungerede vores
eget statistiskbaserede maskinoversættelse, kaldet "MT@EC" rimeligt,
men der skulle rettes megen grammatik og ordstilling. Fra 2018 skiftede
systemet navn til eTranslation, og begyndte at levere neural
maskinoversættelse. Det har hævet kvaliteten markant.
Vores maskiner trænes jævnligt med vores egne data, og da
vi råder over en database med al oversat tekst tilbage fra midten af 1990'erne,
har vores eTranslation Team i teorien 1 mia. segmenter af god
kvalitetsoversætteskvalitet at træne med. Efter større investeringer fra DG
Connect er kapaciteten blevet udvidet, og hvor det tidligere kun var offentlige
myndigheder og videeregående uddannelsesinstitutioner, som kunne få adgang til
eTranslation, er kredsen nu udvidet til små og mellemstore virksomheder i EU.
Det kræver blot, at man lader sig registrere. De tekster der bliver sendt til
eTranslation bliver ikke lagret - og der gemmes heller ingen personoplysninger.
Vi beholder kun statistik om antal dokumenter og sider, der er sendt til
oversættelse.
Med den udvidede adgang for SMV'er ønsker Kommissionen at
stille et sikkert system til rådighed, som også dækker de mindre EU-sprog,
herunder dansk. På den måde kan SMV’er få hjælp til at overvinde sproglige
barrierer, når de opererer på det indre marked.
Der er den seneste tid blevet sat turbo på udviklingen af
Kommissionens eTranslation, bl.a. er der tilføjet en maskine, som skal trænes
med ikke-EU-tekst (general language). Der er også (begrænsede) muligheder for
at tilføje domænespecifikke maskiner. Fx har eTranslation-teamet for nylig
udviklet en maskine til det finske statsministerium, som er trænet med relevant
materiale.
Ingen kommentarer:
Send en kommentar