søndag den 15. juli 2018

Hvad er sprogarbejde i dag? Hvor bevæger det sig hen?




Sprog og arbejde med sprog er mange ting. Jeg opdeler det i disse sproglige kategorier:

Sproglige kategorier

Ø  Det talte sprog, retorik, rådgivning, mundtlig formidling og formidling via podcasts og videoer

Ø  Oversættelse, samspillet mellem sprog, kultur og lokalisering

Ø  Sproglig korrekthed, retskrivning, sproglig branding og klarsprog

Ø  Virksomhedskommunikation, sprogpolitikker, SEO og keywords, opbygnings af termbanker i virksomhederne, styleguides mv.

Ø  Sproget i de digitale miljøer, sociale medier, mundtlig skriftlighed (uformelt mediesprog) hjemmesider, sproglig konfliktstyring

Ø  Nye halv- og helautomatiserede programmer til brug for sprogproduktion og -analyse.

Sprog som faglig fællesnævner
Rigtig mange mennesker har det tilfælles, at de er begejstrerede for sprog. Sprog er mangfoldigt. Når sprog som begreb opbrydes i mindre enheder, deler interesserne sig også. Nogle er af den opfattelse, at sprog slet ikke er en professionel færdighed, f.eks. i forbindelse med kommunikation og marketing. Måske fordi sproget er en mere eller mindre medfødt kompetence.

Nogle arbejder med sproget som værktøj, f.eks. krisekommunikation, hvor det er vigtigere hurtigt at komme ud med et budskab end at sproget er formelt korrekt. Andre med sproget i fokus, eksempelvis en kampagne, hvor sprog, kulturmarkører og stil er nøje tilpasset og afstemt en målgruppe. Som et godt eksempel på en mindre vellykket indsats er Sundhedsstyrelsens aktuelle vejledning til landets sundhedsplejersker blevet ”misforstået” og ”udlagt” som en blåstempling af vegansk kost til spædbørn (Pol. juni 2018). Atter andre arbejder med sprog i de sociale medier, hvor det skrevne sprog har karakter af mundtlighed og således bryder med mere formelle regler. Sproget er altid  til stede i arbejdsopgaverne. Professionel sprogbehandling er ikke en medfødt kompetence, men et fag.

Mundtligt eller skriftligt
Sprogfolk arbejder både med det talte sprog (medieret og umedieret) og med det skrevne sprog (medieret). Det talte sprog eksempelvis i forbindelse med kommunikationsrådgivning og undervisning. Men også talt sprog i medier, for eksempel videoer og ikke mindst nu podcasts.

Sproget vil i stigende grad blive mundtligt, når vi kommunikerer med chatbots, Google Assistant osv. I de sociale medier skriver vi med udprægede talesprogskarakteristika. Konferencetolkning er mundtlig og medieret, dialogtolkning er mundtlig, men foregår i stigende grad medieret via eksempelvis Facebook, Skype, videostationer og Apps. Regeringens  tolkeudbud i juni 2018 i den offentlige sektor nævner eksplicit teletolkning.

Det offentliges kommunikation - Digitalisering af den offentlige sektor
Forvaltningsloven fastlægger, at myndighederne skal kommunikere klart og præcist med borgerne. Den stadig mindre fysiske kontakt til offentlige myndigheder, færre telefonsamtaler og mere og mere ”digital selvforvaltning” nødvendiggør, at sproget i de offentlige systemer forbedres, at databaserne kan tale sammen og at begreber betyder det samme alle steder: Sundhed.dk, sundhedsplatformen, borger.dk, skat.dk. Et eksempel på, hvordan den digitale kommunikation ”fortrænger” det personlige møde, er kommunikation med den praktiserende læge. I dag foregår 15 procent, mere end 6 millioner konsultationer om året, af de praktiserende lægers konsultationer digitalt.

Her et eksempel på en aktuel opgavebeskrivelse i forbindelse med sundhedsplatformen: 

Derfor har institutioner som Digitaliseringsstyrelsen, Danske Regioner, Kommunernes Landsforening, Dansk Sprognævn og Terminologigruppen et øget fokus på klarsprog og ensartet terminologi.

I regeringens digitaliseringsstrategi 2016 understreges det:
”Kommunikationen til borgere og virksomheder skal være klar og sammenhængende, så brugerne er velinformerede og føler sig trygge. Brugerne skal møde en serviceorienteret offentlig sektor der hurtigt og effektivt guider dem gennem de relevante myndighedsområder og tilbud. Dårligt sprog eller komplicerede regler og processer må ikke stå i vejen for en hurtig og effektiv kommunikation.”

Statsrevisorerne, beretning om fejludbetalinger af sociale ydelser, 10/2013, skriver:
”… At myndighedernes kommunikation med borgerne i flere tilfælde er præget af svært sprog og dårlig opsætning af breve og skemaer, at borgerne ikke forstår deres ret og pligt, når de er modtagere af sociale ydelser. God skriftlig kommunikation med borgerne bliver stadig vigtigere på grund af den stigende digitalisering af kommunikationen mellem borgere og myndigheder.”

Med automatiseringen er der kommet øget fokus på udvikling af dansk taleteknologi. Danske teknologivirksomheder er bagud i sammenligning med globale virksomheder som Lionbridge, Apple og Google. Eksempelvis har Lionbridge netop betalt indfødt dansktalende for at indtale lydfiler. Google Assistant er på trapperne på dansk.  

Eksempel på Lionbridge’s aktuelle aktiviteter i Danmark:



Sprogteknologisk Udvalg
Folketinget nedsat et Sprogteknologisk Udvalg. Se indledningen til kommissoriet for Sprogteknologisk Udvalg i casesamlingen.

EUs digitale indre marked
Digitaliseringen af den offentlige sektor i Danmark finder sin parallel i digitaliseringen af ”den offentlige sektor” i EU, her blot flersproget. Den digitaliserede, flersprogede kommunikation er en hjørnesten i opbygningen af EUs digitale indre marked. Der arbejdes blandt andet på at styrke tjenester baseret på maskinoversættelse og tekster leveret fra medlemslandene. En forordning om gensidig anerkendelse af flersprogede, privatretlige dokumenter, træder i kraft til august. EU skal kommunikere digitalt med medlemslandene.

Det flersprogede Danmark

Mange mennesker i Danmark har ikke dansk som modersmål eller som deres første sprog. På Rigspolitiets tolkeliste er opført mere end 125 forskellige sprog og sprogvarianter. Rigspolitiet har netop sendt tolke- og oversætteropgaver inden for retsvæsen, asyl, politi, udlændinge- og migrationsområdet i offentligt udbud. Udbuddet lyder på 520 millioner kr. Men mange andre ”almindelige” offentlige instanser bruger ressourcer på at kommunikere på fremmedsprog. Digitaliseringsstyrelsen udarbejder videoer på de største indvandrersprog blandt andet med det formål at få målgruppen til at udfylde forskudsopgørelser. SKAT arbejder både med dansk, fremmedsprog, oversættelse og klarsprog.

Se Skats egen beskrivelse af arbejdsopgaverne i stillingsopslaget ”Translatør til Tekst og Sprog”, samt om RUT-registeret, i casesamlingen.


I takt med at virksomhederne lancerer internationale eller globale kampagner, eller ønsker at sælge via e-handel, øges behovet for sprogligt og kulturelt tilpasset kommunikation. Det amerikanske ungdomsblad Vice har netop lanceret en dansk version, Netflix producerer nu film lokalt. En almindelig dansk virksomhed som Coolshop.com har hjemmesider på følgende sprog: dansk, tysk, svensk, engelsk, finsk, norsk og hollandsk. Kamstrup.dk har hjemmesider på engelsk, tjekkisk, dansk, tysk, spansk, finsk, fransk, hollandsk, norsk, polsk, russisk, svensk og tyrkisk. Kamstrup.dk har endvidere produktbeskrivelser på dansk, engelsk, amerikansk engelsk, kinesisk, tjekkisk, tysk, spansk, finsk, fransk, hollandsk, norsk, polsk, rumænsk, russisk og svensk. VOLA har hjemmesider på dansk, engelsk, tysk, fransk, svensk, hollandsk og spansk.

BoConcept
Virksomheden BoConcept er repræsenteret i 60 lande med 270 butikker. BoConcept markedsfører sig blandt andet med et stort katalog. Koncernsproget er engelsk, men copywritere sørger for tilpasning til de lokale markeder. Oversættelserne udarbejdes direkte i Indesign. BoConcept arbejder på 18 sprog. Oversættervirksomheden Semantix, der oversætter og lokaliserer for BoConcept, taler om ”Create Once Publish Everywhere”, hvor teksterne produceres én gang på et ”mastersprog”, engelsk eller dansk, og derefter genbruges i lokaliserede versioner, ”Single Source Management”. De taler om ” Linguistic data – the next oil boom”.





SEO og keywords
Terminologi i form af keywords og Search Engine Optimizing (SEO) kan have afgørende indflydelse på udfaldet af en markedsføringskampagne. Det er en ”ny” måde at arbejde med terminologi på. De danske Jabra hovedtelefoner klarede sig ikke godt på det franske marked, indtil virksomheden fandt på at udskifte deres engelske keywords med franske. Et andet eksempel er ”sofa”. En sofa hedder i England ”a sofa”, i USA “a couch”. Et tredje eksempel er ”suck”. ”Nothing sucks like Electrolux” går kun nogle steder, og derfor går det ikke. Professionel sproglig ballast er i denne sammenhæng essentiel, også for marketingfolk.

Strukturerede ustrukturerede sproglige data – EU’s direktiv om ophavsrettigheder
Udgangspunktet for kunstig intelligens og automatisering er ustrukturerede data. Sprog er data. Det er så vigtig en dataressource, at sproglige data i udkastet til EUs direktiv om ophavsrettigheder i det digitale indre marked bliver fritaget for ophavsrettigheder til brug i forsknings- og kulturinstitutioner, såkaldt tekstmining.  Eksempelvis har Dansk Sprognævn, Det Danske Sprog- og Litteraturselskab og Center for Sprogteknologi problemer med at bruge tekst fra store tekstkorpora (tekstsamlinger), fordi andre har ophavsretten til teksterne. Læs direktivets definition af tekstmining og pressepublikationer i casesamlingen.

Automatisk generering af tekst og tale
Automatisk generering af tekst og tale er et område i kraftig vækst. Programmer til tekstproduktion på basis af ustrukturerede data pibler nu frem som krokusser i forårssolen. Eksempler bringes nedenfor.

IBM
En central spiller i udviklingen af kunstig intelligens på basis af ustrukturerede sproglige data er IBM. IBM skriver på deres hjemmeside blandt andet:

"I dag forstår og kommunikerer Watson (IBM’s supercomputer) på ni forskellige sprog".  Og "Watson er i stand til at forstår ustruktureret information så som billeder, naturlig tale og indhold i bøger, e-mails, tweets, blogs og meget mere.”

Ifølge IBM er 80 procent af al data, herunder sprog, ustruktureret. Derfor er det nødvendigt at arbejde med ”Natural Language Processing”, NLP, altså databehandling af naturligt sprog, til brug for machine learning og kunstig intelligens.

IBMs Tone Analyzer
IBMs tone analyzer analyserer følelser, som de kommer til udtryk i tekst: Glæde, frygt, tristhed, analytisk, fortrolig og spørgende. Det er muligt at justere følelsesregisteret ved at ændre tonen i teksten og på den måde ændre modtagerens opfattelse af teksten eller forbedre tekstens effektivitet.

“The IBM Watson™ Tone Analyzer service uses linguistic analysis to detect emotional and language tones in written text. The service can analyze tone at both the document and sentence levels. You can use the service to understand how your written communications are perceived and then to improve the tone of your communications. Businesses can use the service to learn the tone of their customers' communications and to respond to each customer appropriately, or to understand and improve their customer conversations in general. The following diagram shows the basic flow of calls to the service.”



Læs mere om IBMs Tone Analyzer Service i casesamlingen. 

Watson Personality Insights
Tone Analyzer analyserer teksten, ikke forfatterens personlighedsprofil. Til det formål skal man bruge Watson Personality Insights service: "Predict personality characteristics, needs and values through written text. Understand your customers’ habits and preferences on an individual level, and at scale."  Læs mere i casesamlingen.

Digital.com
Virksomheden digital.com analyserer følelsesudtryk i tweets og andre sociale medier: "Sentiment analysis (also known as opinion mining) refers to the use of natural language processing, text analysis, and computational linguistics to identify and extract subjective information in source materials. Sentiment analysis is widely applied to reviews and social media for a variety of applications, ranging from marketing to customer service."

Sig goddag til dine nye robotkollegaer - hvordan ændrer arbejdsmarkedet sig?
Den danske virksomhed lasso.dk bruger robotter til nyhedsskabelse. Lasso.dk skriver på deres hjemmeside: ”På sitet kan du finde robotgenererede artikler om dansk erhvervsliv. Artikler, som skrives og automatisk opdateres hver eneste gang, der fx registreres en ændring i forskellige virksomhedsregistre.”

Andre aktiviteter med sprog
Der er naturligvis mange andre måder at arbejde med sprog. I takt med den øgede mængde af automatisk genereret tekst har nogle firmaer specialiseret sig i korrekturlæsning. EU har indgået aftaler med eksterne virksomheder, der udelukkende læser korrektur på teksterne. Der skal laves style guides og sprogpolitikker i organisationerne.  Nogle tekster film, andre oversætter skøn- eller faglitteratur eller oversætter nyheder til digitale nyhedsmedier. Der skal opbygges termbanker i organisationerne og implementeres teknologi til sprogbehandling. Nogle elsker læseklubber for romaner på fremmedsprog, andre elsker sprogblomster og sjove skilte. 


Casesamling 



Sprogteknologisk Udvalg. De indledende ord i kommissoriet lyder:
”En stor del af vores viden er formuleret på et sprog. Størstedelen af den viden vi har om Danmark, om danske forhold og om hinanden er formuleret på dansk. Kunstig intelligens er typisk baseret på analyse af store datamængder. Det giver gode resultater når disse data er tal, men det er en langt større udfordring når data består af sprog i form af tekst og lyd. Tal er entydige og svarer til den måde computerne er indrettet på. Sprog er mangetydigt og langt mere komplekst fordi det er en del af vores eksistens og tæt sammenvævet med vores viden om verden, om den måde vores samfund er opbygget på, og om den kultur vi er opvokset i.

Langt de fleste systemer som har en sproglig kapacitet baseret på kunstig intelligens er udviklet på basis af data fra andre sprog, først og fremmest engelsk. De reflekterer derfor en forestilling om en verden, et samfund og en kultur som ikke stemmer overens med vores. Derfor skal systemer som bruger kunstig intelligens udvikles på basis af danske sprogdata for at kunne fungere optimalt og gøre nytte i vores samfund.”

Stillingsopslag: SKAT: Translatør til Tekst og Sprog i den kommende Skattestyrelse
”Kan du engelsk på højt niveau, og kunne du tænke dig at arbejde med sprog i den kommende skattestyrelse? Vi søger en translatør i engelsk med et højt fagligt niveau og erfaring med oversættelse af økonomiske og juridiske tekster.
OPGAVER
Translatøren skal i tæt samarbejde med husets andre translatører medvirke til at styrke den eksterne kommunikation med engelsktalende borgere og virksomheder. Oversættelserne omfatter primært tekster til den engelske hjemmeside, breve, blanketter, vejledninger og diverse ad hoc-oversættelser fra dansk til engelsk. Sprogrevision og korrekturlæsning vil også blive en del af dine opgaver. Desuden skal du deltage i forskellige administrative opgaver, bl.a. i håndteringen af bestilling af oversættelser.
DIG 
Du er uddannet cand.ling.merc. (translatør og tolk), cand. interpret. eller cand.mag. i engelsk. Du har erfaring med og brænder for oversættelse – primært fra dansk til engelsk – og sprogrevision af faglige tekster ofte af høj kompleksitet inden for økonomi og jura. Endvidere er det en fordel, at du har erfaring med at skrive til nettet og med CMS. Derudover forventer vi, at du:
 Har kendskab til oversættelsesværktøjer og terminologihåndtering (vi bruger memoQ).
 Evner både at arbejde selvstændigt og indgå i diverse samarbejder på tværs af fagområder i organisationen.


Du bliver ansat i Tekst og Sprog, der er et kontor i Personprocesser, Person. Her får du 19 engagerede og kompetente kolleger, hvor du vil indgå i teamet Fremmedsprog sammen med 2 engelske translatører, 1 tysk translatør og 1 udviklingskonsulent. Tekst og Sprog har bl.a. ansvaret for fremmedsprog, den engelske og tyske hjemmeside, oversættelsespolitik og for, at den skriftlige kommunikation til borgere og virksomheder på dansk og fremmedsprog fremstår ensartet, korrekt og forståelig.”

RUT
RUT er et redskab for Arbejdstilsynet og SKAT til at føre tilsyn med, om udenlandske virksomheder betaler skat og overholder arbejdsmiljøloven i Danmark. Registeret er på dansk, engelsk, tysk og polsk

https://indberet.virk.dk/myndigheder/stat/ERST/Registrering_af_udenlandske_tjenesteydere_RUT__Registration_of_Foreign_Services_RUT

EUs direktiv om ophavsrettigheder – definitioner
Tekst- og datamining: Enhver automatiseret analytisk fremgangsmåde, der har til formål at analysere tekst og data i digital form med henblik på at generere oplysninger som f.eks. mønstre, tendenser og korrelationer.”

Pressepublikationer
Også resumerede ”tekstbidder” fritages i et vist omfang for ophavsret. Sådanne tekstresuméer genereres i vid udstrækning automatisk. Pressepublikationer defineres sådan:

”"Pressepublikation": en konkret samling litterære værker af journalistisk karakter, der også kan bestå af andre værker eller frembringelser, og som udgør en individuel enhed inden for en periodisk eller regelmæssigt opdateret udgivelse under én enkelt titel, f.eks. aviser eller magasiner af almen eller specialiseret karakter, der har til formål at bringe oplysninger i form af aktualitetsstof eller om andre emner, og som udgives i medier på en tjenesteudbyders initiativ og under dennes ansvar og kontrol.”

”Medlemsstaterne sørger for, at udgiverne af publikationer indrømmes rettigheder til den digitale anvendelse af deres pressepublikationer.”

IBM Tone Analyzer Service







Lasso”Lasso giver dig data om danske virksomheder og personer i det danske erhvervsliv. Med branchespecifikke produkter gør vi det muligt at bruge data til at spare tid, effektivisere arbejde og træffe de kloge beslutninger. Produkterne er udviklet i samarbejde med relevante fagpersoner – vi tror på, at revisorer bedst ved, hvordan revisionsarbejde optimeres, og sælgere bedst ved, hvordan markeds- og kundedata kan bruges til at øge salg. Data henter vi fra en række forskellige kilder: CVR, Tinglysningsretten, Ejerregisteret etc. Vi viser altid realtime data direkte fra kilden – og du kan hente regnskaber og gemme dem direkte fra løsningen. Lasso laver markedsdataprodukter baseret på offentlige data – målrettet dine præcise behov. På én gang kan du spare tid og have den rette data og indsigt til at træffe de rigtige beslutninger. ”https://lasso.dk/




1 kommentar: