torsdag den 9. maj 2019

Bot bot robot – klart robotsprog



Hvordan udvikler vores sprog sig? Automatisering og kunstig intelligens (AI) kommer til at forandre vores kommunikationsmønstre. Også det danske sprog vil blive påvirket.  

Begrebet klarsprog bruges i relation til offentlige myndigheder, organisationer og institutioner, der kommunikerer med borgerne. Som tiderne, teknologien og borgerne ændrer sig, ændrer måden, man skal ”udtrykke sig ligefremt og uden omsvøb” på, sig også. Begrebet retter sig især mod skriftlig kommunikation, fra papir til sociale medier. 

Kursiveringen ovenfor hidrører fra Sproget.dk, der forklarer klarsprog som ”det at udtrykke sig ligefremt og uden omsvøb.”  Den Danske Ordbog anvender en definition fra kommagasinet.dk: ”klarsprog er en modsætning til bureaukratsprog, skrankepavesprog og kancellisprog. Målet med klarsprogsarbejdet er, at offentlige myndigheder skal udtrykke sig til borgerne på en klar, forståelig og ensartet måde”.



Hvordan udtrykker man sig så lige ligefremt og uden omsvøb? Det er der mange kommunikatører, sprogfolk, terminologer og oversættere, der beskæftiger sig med hver dag. 

Anne Kjærgaard fra Dansk Sprognævn og Gitte Gravengaard fra Københavns Universitet forsker i kommunikationsmodeller, som de kalder paradigmer. De arbejder med fire modeller, der har udviklet sig over tid, fra 1 til 4. Selvom et paradigme følger efter et andet, er de også alle til stede samtidigt. Sådan som vi i dag kommunikerer digitalt, men også skriver på papir, læser trykte aviser osv.

Udgangspunktet har indtil nu været, at der er tale om kommunikation mellem mennesker. Det vil ikke altid være tilfældet fremover. Mens paradigme 1 har hovedfokus på tekster og sprog, paradigme 2 på kommunikation i kontekst, paradigme 3 på interaktion, har det aktuelle paradigme 4 hovedfokus på adfærd og bevæger sig i retning af datadreven rådgivning (fra myndigheden), menneske-maskine interaktion, individualisering og netværksteori.

Det er de ikke alene om at mene. Temaet for Sprogdagen 2019 var det digitale sprog. Rammesætningen af temaet på Sprogdagen var formuleret sådan:

”Hvad gør teknologien ved vores kommunikation, ved vores sprog og ved os selv? Digitaliseringen af vores kommunikation på de sociale medier giver alle umiddelbar adgang til at ytre sig. Også vores kommunikation med det offentlige Danmark sker i stigende omfang digitalt. Snart vil vi forvente at blive betjent af chatbots, så vi ikke skal vente i lange telefonkøer. Det bliver nemmere, hurtigere, og når vi selv vil. Digitaliseringen af vores kommunikation påvirker også vores sprog og vores sproglige udtryk. Skriftsprog bliver til talesprog, vi taler til maskinerne, og maskinerne taler til os. Vi behøver ikke længere at se hinanden i øjnene, når vi kommunikerer. Hvad betyder det for nærværet, etikken og tilliden?
 
At udviklingen hastigt går mod automatisering af mundtlig kommunikation blev understreget i marts måned, da regeringen offentliggjorde sin nationale strategi for kunstig intelligens (AI-strategi). Heri skriver regeringen blandt andet: 
 
”For skal kunstig intelligens genkende tale eller tekst, sådan som for eksempel chatbots eller digitale assistenter gør, så kræver det, at den er blevet fodret med data på dansk af høj kvalitet”... ”På skrift bruges det ligeledes til automatisk at oversætte mellem sprog og til at kommunikere med virtuelle assistenter som voice- og chatbots.

Brugen af kunstig intelligens og maskinlæring baseret på danske data, det danske sprog, er ny. På engelsk er man nået meget længere. Virksomheden Virtue Nordic, der er baseret i København, har sammen med Copenhagen Pride og Equal AI udviklet en kønsneutral stemme, der hedder Q. Dansk Markedsføring citerer folkene bag stemmen:

 ”…at et af formålene faktisk er at anerkende, at der findes mere end to køn, når der udvikles AI-baserede apparater’... ’Teknologi skal have sine rødder i nye kulturelle sandheder i stedet for forældede. Q repræsenterer ikke én stemme, men er for alle dem, der kæmper for en fremtid, som inkluderer alle.

Virksomheden OpenAI, stiftet af blandt andre den kendte Elon Musk, har udviklet en sprogmodel GPT-2, der er så god til at generere overbevisende, velskrevet tekst, at den bliver holdt tilbage, fordi folkene bag frygter misbrug. Modellen er trænet til at forudsige det næste ord, med basis i en tekstsamling på 40 gigabyte internettekst. Systemet genererer efter sigende tekst, der tilpasser sig kildetekstens stil og indhold. På virksomhedens hjemmeside er der syv eksempler på autentisk kildetekst og automatisk genereret tekstoutput. 

Regeringens AI-strategi nævnte for første gang nogensinde eksplicit sprogteknologi, og bevilgede i samme åndedrag 30 mio. kroner. Finansministeriet skriver i en pressemeddelelse:

”For skal kunstig intelligens genkende tale eller tekst, sådan som for eksempel chatbots eller digitale assistenter gør, så kræver det, at den er blevet fodret med data på dansk af høj kvalitet. Men fordi dansk er et lille sprogområde, har det ikke været attraktivt nok for virksomheder at investere i at få udvikle en dansk sprogressource.”

Sprogteknologifolket klappede i hænderne, men håber, at der kommer endnu flere penge. Det kan ske på baggrund af rapporten ” Dansk Sprogteknologi i ierdensklasse”, der blev offentlig gjort i marts måned. Tidligere direktør i Dansk Sprognævn udtaler:
”Sprogets betydning for udvikling af kunstig intelligens har i alt for lang tid været overset. Mange tror at data kun er tal, men faktum er at der ligger enorme mængder af viden om os og vores samfund gemt i danske tekster og optagelser af dansk tale. Men man skal knække sprogkoden for at forstå indholdet – og det kræver bedre dansk sprogteknologi og fri adgang til flere sproglige data.” 
Måske bliver svaret på din telefoniske henvendelse til kommunens voicebot fremover skrevet og sendt til dig af en robot. Måske kan du bede om at tale med en kønsneutral robotstemme. Og måske er det robotten, der i fremtiden vil bede dig om at udtrykke dig ”ligefremt og uden omsvøb!” Det bliver sjovt. 

Jørgen Christian Wind Nielsen 

Artiklen har været bragt i Den Danske Sprogkreds blad Sprogkræsen, foråret 2019https://lisebostrup.dk/den-danske-sprogkreds/

Kilder: 
Gennembrud for dansk sprogteknologi

Dansk Sprogteknologi i verdensklasse

kommagasinet

OpenAI

Markedsføring

Kønsneutral stemme
Techcrunch


Med ført pen, 24/3/2020

Jeg har skrevet en artikel om kønnet sprog, om inklusion og eksklusion i sproget, og om automatiserede skriveprogrammer. Den er god, ikke fordi jeg har skrevet den, men fordi den giver et indblik i, hvilken udvikling, der er på vej, både i forhold til køn og i forhold til automatiseret skrivning. Aalborg Universitet og Europa-Parlamentet går i front.


Reflektér over stereotypt sprogbrug
”Sprog har magt til at definere, kategorisere og skabe sandheder, der påvirker det/de personer, vi taler om. Vi skal forholde os bevidst og kritisk til normer i sproget og sikre, at vi ikke ubevidst genskaber herskende fordomme om, at drenge kan dét og piger kan dét”  


https://windwebsites.blogspot.com/2020/03/med-frt-pen.html

søndag den 5. maj 2019

Den demokratiske europæiske offentlighed



Den europæiske offentlighed er en god ting, men den er svær. Den Europæiske Union er forenet i mangfoldighed, især kulturel og sproglig mangfoldighed. Hvilket sprog skal en demokratisk debat i den europæiske offentlighed foregå på?
Det nærliggende svar er engelsk. Men mange, mange mennesker i EU, alt for mange, har problemer med at læse og skrive på deres modersmål. For dem er engelsk helt udelukket. 
Mange mange mennesker i EU kan slet ikke engelsk. For dem er engelsk helt udelukket. 
Kun engelsk modersmåltalende kan give udtryk for og debattere komplicerede tanker og følelser på engelsk. Og så er engelsk jo det verbale udtryk for en specifik kultur. 
Sprog kan være inkluderende og sprog kan være ekskluderende. I en europæisk demokratisk sammenhæng er brugen af andre sprog end ens eget modersmål  ekskluderende. 
Heldigvis findes der flersprogede  nyhedsbreve og tv-kanaler, der med EU som platform kommunikerer til borgere i EU. Dem kommer der flere af. Og politiske partier indgår nu valgalliancer på tværs af landegrænser til EU-parlamentsvalget. Flersprogede digitale sprogdatabaser beregnet til maskinoversættelse mellem EU-landene er under opbygning, så borgerne på sigt vil kunne kommunikere skriftligt, og engang også mundtligt, på deres eget sprog. Afsenderne vil kunne skrive på deres eget sprog, modtagerne af budskaberne vil med brug af let tilgængelig maskinoversættelse kunne læse budskaberne på deres sprog. Så kan vi få en demokratisk europæisk offentlighed, der er forenet i mangfoldighed.
"Vote together", er,efter eget udsagn, et projekt, der opmuntrer stemmeberettigede borgere i EU til at sprede kendskabet til og stemme til EU-parlamentetsvalget i maj 2019. "Vote together" er søsat af "Between Bridges", en fond der har til formål at støtte demokrati, international forståelse, kunst og LGBT-rettigheder. "Betweeen Bridges" er skabt af Wolfgang Tillmans i 2017. Bloggen på internettet er på seks forskellige sprog. På sitet kan man også købe t-shirts med logo på 24 officielle EU-sprog, ligesom man kan downloade løbesedler med teksten 26. maj fra hjemmesiden på EU-sprogene. Det hele lyder jo meget godt. 
Men hvorfor kommunikerer projektet til den danske offentlig på en reklamesøjle i krydset ved Emdrupvej og Lyngbyvej på engelsk? 

Hvis debatten i den europæiske demokratiske offentlighed skal foregå på engelsk, ønsker vi ikke at deltage!




fredag den 3. maj 2019

Counterpoint - CEATL's European translators's e-zine



"We are very happy to present the first issue of CEATLS's brand new e-zine, a bi-annual periodical appearing in both an English and a French version.
Counterpoint is an e-zine for everyone interested in literary translation, whether you are a translator, publisher, agent, researcher, student or journalist, or just have a general interest in literature across borders, the European book market, and in the people that shape both. Read on. 

Contrepoint
la revue européenne des traducteurs littéraires du CEATL
C’est pour nous une grande joie de vous présenter le premier numéro de notre revue, qui paraîtra deux fois par an en anglais et en français.
Contrepoint est une revue en ligne qui s'adresse à toute personne intéressée par la traduction littéraire. Vous travaillez dans l'édition, la recherche, les institutions du livre, vous êtes étudiant, journaliste ou, plus généralement, vous aimez suivre l'actualité de la littérature au-delà des frontières, du marché européen du livre, de ceux qui font l'une et l'autre ? Vous y trouverez des informations qui vous parlent."