”We
always need a translator in the loop!”
Translating Europe Workshop: Fup og fakta om maskinoversættelse anno 2023
Claus Thornby Larsen, EU-kommissionen og vært sammen med Aarhus Universitet, bød velkommen til de mange fremmødte ”in person”, og de mange deltagere online.
Kunstig intelligens er også ”talk of the town” på oversættelsesområdet, selv om automatisering og maskinoversættelse har været hverdagskost på oversætterområdet i mange år.
Hvordan opfattes maskinoversættelse - MT – af kunder, bureauer og af oversætterne selv?
Europa-Kommissionen er verdens største offentlige oversættelsestjeneste. Måske er private virksomheder som Google Translate og Microsoft Bing større. 35%-40% af de dokumenter, der modtages i DGT, Generaldirektoratet for Oversættelse i Europa-Kommissionen, outsources til externe oversættere.
Maskinoversættelse har over tid bevæget sig fra regelbaserede systemer over statistikbaserede til nu neuralt baserede. Der bruges mange andre værktøjer, fx resumeringsværktøjer og værktøjer til at sammenligne semantik. Centralt i DGT’s værktøjskasse er eTranslation.
Forskerne Tina Paulsen Christensen fra Aarhus Universitet og Kristine Bundgaard fra Aalborg Universitet afstak på et forskningsbaseret grundlag rammerne for debatten. Hvad ved vi, hvad ved vi ikke? Fup og fakta om maskinoversættelse.
Forskningen har bevæget sig fra tekstmining til maskinoversættelse. Alle taler om det … automatisering. Oversættererhvervet var det første kreative erhverv, der blev automatiseret. Nu sker der en sammenkædning af oversættelsesteknologien med den bredere udvikling inden for sprogteknologi.
Andre fag og erhverv kommer til at opleve udviklingen på kortere tid, automatisk tekstgenerering. Generativ AI.
”Natural
language generation” kan deles i data til tekst-generering, ”robotjournalistik”,
versus tekst-til-tekst-generering: ”To produce understandable texts in human
language”. ”No language left behind!”. Det kan være korte prompts til tekster. Automatisk
resumering, automatisk parafrasering, maskinoversættelse. Prompting/prompt
engineering. Prompt literacy er nogle nye begreber, nogle nye kompetencer.
Hvad har oversættelsesmaskiner og selvkørende biler til fælles: De flytter fra ét sted til et andet, fra kildetekst til måltekst. Hvad er oversætterens rolle i maskinoversættelse?
Undersøgelser viser, at post-editing går hurtigere end oversættelse fra scratch. Kvaliteten er steget med neural maskinoversættelse, fx er fluency blevet meget bedre. Men maskinoversættelse laver også fejl, uønskede flertydigheder og kulturelt uhensigtsmæssigt indhold. Maskinoversættelser har mindre varieret ordvalg og bærer præg af kildesproget. Maskinoversættelser introducerer ikke-eksisterende ord og udelader ord i målteksten. Tiltale og formalitetsniveauer er også et problem. Problemer med bias. Ønsket eller uønsket tvetydigheder. Og hvad med det, der står mellem linjerne, tilføjer jeg.
Ophavsret er et centralt problem, som også internationale organisationer beskæftiger sig med. Får oversætteren en mindre central rolle? Det er nødvendigt med en konstant opdatering af kompetencer.
Phrase/Memsource giver et procentuelt estimat over hvor god den selv synes dens maskinoversættelse er.
” Small distance to target text – great distance to target text”. Oversætterne bliver bombarderet med oversættelsesforslag. Men hvad står der egentlig i teksten.
Technical effort – skrivearbejde. Cognitive effort – håndtere teknologi, systemer og output. Der skal bruges mere tid på systemhåndtering end på oversættelse. Tid som der måske ikke gives betaling for.
To beretninger fra oversætterpraksis
Natascha Tøsse fortalte om undertekstning.
To use or not to use Svært med idiomatiske udtryk.
Teksterne bliver udstyret med en ”English Master De udenlandske streamingplatforme kommer med teknologien, hvor en tvivlsom effektiviseringsgevinst kun er til glæde for tekstbureauerne. Vi skal blive ved at slå på
kvalitetstrommen! Klag hvis der er fejl i underteksterne! Tjek Undertekster.dk! |
Anne Friis overvejede om maskinoversættelse
er en ven eller en fjende. Med Phrase – MT har fire ”engines”.
Anne bruger dem til alle teksttyper. De kan bruges Kvalitetssikring. Autogenererede
forslag kan bruges til at tage
stilling til Maskinoversættelse kan svække
kreativiteten en smule og give mere post-editing. Maskinen læser og producerer
bogstaver og kombinationer af bogstaver. Derfor går Skal vi ændre på vores
serviceydelser – ikke endnu, mener Anne. Skal vi informere Er jeg mindre ekspert hvis jeg
bruger maskinerne? – det udfordrer den Bureauerne fortæller dig hvordan du skal arbejde, og du
får i øvrigt også mindre Opsummering |
Vi skal arbejde os frem til et fælles bud på, hvad oversættelseskunder bør vide om maskinoversættelse og om hvordan den professionelle oversætter skaber værdi.
Der blev
drøftet en række budskaber til opdragsgiverne. Der er et åbent vindue lige nu,
og det er en anledning til at udarbejde en strategi over for markedet.
Vil du vide mere?
Oplæggene fra workshoppen vil blive lagt online efterfølgende. Translating Europe Workshop (TEW) er den decentrale del af Translating Europe Forum, indstiftet af DGT. En ny TEW om undertekstning planlægges til oktober i Europa-Huset i København.
Se billeder
fra workshoppen her/