tirsdag den 17. april 2018

Sprogteknologisk udvalg og terminologi



Terminologigruppen i Danmark
De fleste af os med en handelshøjskolebaggrund husker nok muligheden for at skrive terminologispeciale. Det var noget med et overbegreb, f.eks. en cykel, og en masse underbegreber, en racercykel, en sportscykel osv. Overbegrebet kunne også være transportmidler. Man kunne blive ved.
Så fandt man en definition, så lavede man det samme på sit fremmedsprog. Og vupti, en ordbog.

Ingen vidste dengang, at Danmark ville blive et af, måske det mest digitaliserede land i verden. Nu er vi i registre, sprog er data, og databaserne skal kunne tale sammen og udveksle data. De skal helst være enige om hvad de forskellige ord og begrebet betyder. Tænk bar på sundhedsplatformen og andre fællesoffentlige portaler. Terminologigruppen har ikke ligget på den lade side i alle de år. Den har haft en central rolle at spille i forbindelse med udvikling af ontologier, begrebshierarkier, datastrukturering, termbeskrivelser osv. Terminologigruppen består af et antal interessenter, herunder Translatørforeningen og Forbundet Kommunikation og Sprog. Senest er der i Folketinget fremlagt et beslutningsforslag om etablering af en offentlig, fagsproglig termbank, formentlig med sekretariat i Dansk Sprognævn. Beslutningsforslaget er i udvalgsbehandling i Kulturudvalget.

Terminologigruppen, og altså Forbundet Kommunikation og Sprog, og Translatørforeningen også, har i den anledning sendt en støtteskrivelse til medlemmerne af Kulturudvalget. Den kan ses her.


Billedet er fra møde i Folketingets Kulturudvalg om sprogteknologi

Sprogteknologisk Udvalg
Folketingets Kulturudvalg har også taget initiativ til nedsættelse af et Sprogteknologisk Udvalg, der primo april 2018 offentliggjorde et kommissorium og udvalgets sammensætning. Også medlemmer af Terminologigruppen er repræsenteret i dette arbejde, og dermed også, indirekte, Translatørforeningen og Forbundet Kommunikation og Sprog. Læs mere om Folketingets behandling af  det Sprogteknologiske Udvalg her.

Se billeder fra Kulturudvalgets møde om sprogteknologi, her.

Læs mere om Terminologigruppen her.

Billedet er fra møde i Folketingets Kulturudvalg om sprogteknologi

Kommissorium for det sprogteknologiske udvalg

Start: 1.4.2018

Introduktion

En stor del af vores viden er formuleret på et sprog. Størstedelen af den viden vi har om Danmark, om danske forhold og om hinanden er formuleret på dansk. Kunstig intelligens er typisk baseret på analyse af store datamængder. Det giver gode resultater når disse data er tal, men det er en langt større udfordring når data består af sprog i form af tekst og lyd. Tal er entydige og svarer til den måde computerne er indrettet på. Sprog er mangetydigt og langt mere komplekst fordi det er en del af vores eksistens og tæt sammenvævet med vores viden om verden, om den måde vores samfund er opbygget på, og om den kultur vi er opvokset i.

Langt de fleste systemer som har en sproglig kapacitet baseret på kunstig intelligens, er udviklet på basis af data fra andre sprog, først og fremmest engelsk. De reflekterer derfor en forestilling om en verden, et samfund og en kultur som ikke stemmer overens med vores. Derfor skal systemer som bruger kunstig intelligens, udvikles på basis af danske sprogdata for at kunne fungere optimalt og gøre nytte i vores samfund.

For at man kan bygge et system som fx kan modtage en besked og udføre en ordre på et givet sprog, skal de grundlæggende data og teknologier være til stede for det pågældende sprog. Fx skal der være adgang til store mængder af lydoptagelser og transskriptioner af lyd til tekst. Der skal være teknologier der kan analysere teksten og omforme den til en ordre som computeren, mobiltelefonen eller robotten kan modtage og udføre. Hvis systemet skal kunne svare, skal der også være teknologier der kan udforme et forståeligt svar som er passende i den givne situation.

Sprogteknologi er den fælles betegnelse for de teknologier der kan håndtere disse processer.
De enkelte teknologier indgår ligeledes som enkeltkomponenter i mange programmer som ikke nødvendigvis involverer kunstig intelligens, som fx dikteringsværktøjer, søgemaskiner og undervisningsprogrammer.

Formål
1. Udvalget har til formål at udrede perspektiver og udfordringer for sprogteknologi i en dansk kontekst og komme med forslag til hvordan Danmark bedst sikrer brugen af dansk og andre sprog i digitale tjenester, fx automatisk oversættelse, taleteknologi, IoT (internet of things), robot- og transportmiddelteknologi, IT-baserede læremidler til sprogundervisning og kunstig intelligens.

2. Udvalget har endvidere til formål at afklare behovet og perspektiverne for en national termbank ("sprogtermbank").

Opgave
Udvalget skal med udgangspunkt i et brugerorienteret perspektiv kortlægge de nuværende og fremtidige behov for at benytte dansk og andre sprog samt sproglig viden i forhold til digitale tjenester og applikationer baseret på kunstig intelligens i centrale sektorer af samfundet. Udvalget skal vurdere i hvilket omfang det vil være muligt at imødekomme disse behov under inddragelse af de relevante spillere i erhvervslivet, den offentlige sektor samt uddannelses- og forskningssektoren.

Udvalget skal afklare behovet og perspektiverne for en national termbank (”sprogtermbank”) og inddrage resultater fra arbejdet med dansk terminologi og danske vidensbaser samt med begrebs- og datamodellering i det fællesoffentlige digitale arkitektursamarbejde.

Udvalget skal inddrage relevante resultater fra arbejdet med sprogteknologi og terminologi i andre lande, herunder EU og Norden, og pege på måder hvorpå en styrkelse af dansk sprogteknologi vil kunne gavne den enkelte borger og bidrage til at skabe vækst og effektivisering i samfundet.

Udvalget får til opgave at
  levere en rapport der udreder behovet for sprogteknologi inden for centrale sektorer.
Rapporten skal give svar på følgende hovedspørgsmål:
o Inden for hvilke sektorer og erhverv vil der i de kommende 10 år være størst behov for digitale tjenester og applikationer baseret på kunstig intelligens på dansk og andre sprog?
o Hvilke udfordringer ser virksomheder og offentlige institutioner i forhold til at udvikle disse tjenester og applikationer – og hvilke udfordringer bliver overset?
o På hvilken måde kan sprogteknologi bidrage til at sikre en bedre og billigere offentlig service?
o På hvilken måde kan erfaringer fra andre lande, EU og Norden nyttiggøres?
o Hvilke vækst- og jobmuligheder ligger der i en satsning på dansk sprogteknologi?
o Hvad er den samfundsøkonomiske business case set i forhold til investeringsbehovet?
o Hvilke politiske tiltag kan foreslås for at understøtte virksomheder og offentlige institutioner i at inddrage dansk og andre sprog når der skal udvikles og anvendes nye teknologier baseret på kunstig intelligens?
o Hvilken betydning får en satsning på dansk sprogteknologi for udviklingen af det danske sprog, for samfundets udvikling og for den enkelte?
o Hvordan sikres det at der udvikles dansksproget sprogteknologi?
o Hvad er fordelene og ulemperne ved udvikling af dansk sprogteknologi i Danmark?
o Hvordan kan det sikres at der fortsat uddannes mennesker med tilstrækkelige kompetencer inden for dansk sprogteknologi?
o Hvilket behov er der for udvikling af en dansk termbank, hvilke domæner skal den dække, og hvordan kan den bedst gøres tilgængelig?
  bidrage til oplysning og offentlig debat om sprogets rolle i kunstig intelligens og ny teknologi.
  inddrage offentlige institutioner, virksomheder, brancheforeninger, fagforeninger, fageksperter og borgere med henblik på at sikre at så mange aspekter som muligt bliver belyst.

Udvalgets sammensætning
Udvalget nedsættes som en bredt sammensat arbejdsgruppe bestående af 8-10 medlemmer, en formand og en sekretær. Sekretariatsfunktionen og formandskabet er forankret i Dansk Sprognævn.

Blandt medlemmerne skal være repræsentanter for nuværende og fremtidige udbydere og brugere af applikationer baseret på sprogteknologi og kunstig intelligens i erhvervslivet og den offentlige sektor, repræsentanter for udviklere af sprogteknologi og kunstig intelligens samt repræsentanter for forsknings- og uddannelsessektoren.

Der kan oprettes en række undergrupper for særlige fokusområder, fx social- og sundhedssektoren, uddannelsessektoren, produktionserhverv, serviceerhverv og offentlig administration. Undergrupperne kan hver især supplere med flere medlemmer.

Arbejdsform 
Udvalget afholder en række fokusgruppemøder og seminarer hvor brugere og eksperter inviteres til at præsentere cases og synspunkter der kan belyse hovedspørgsmålene.

Udvalget vil endvidere opsøge en række institutioner og virksomheder samt evt. enkelte nøglelande, fx Holland og Letland, der allerede bruger eller udvikler ny teknologi baseret på sprog og kunstig intelligens, for at inddrage praktiske erfaringer.
Der oprettes en hjemmeside hvor udvalgets sammensætning, opgaver og arbejdsplan fremgår, og hvor udvalgets aktiviteter annonceres. Hjemmesiden vil også være et redskab for bred dialog med alle interessenter.

Udvalget vil invitere alle til at tilkendegive og diskutere synspunkter, ideer og ønsker til brugen af sprog i den digitale teknologi via udvalgets hjemmeside og evt. en Facebook-gruppe.

Resultat
Udvalget afslutter arbejdet med en rapport som overleveres til Kulturministeriet.
Resultaterne kommunikeres bredt via medierne og via udvalgets hjemmeside.

Pressemeddelelse: Pressemeddelelse: Kulturministeren igangsætter sprogteknologisk udvalgsarbejde

Dansk Sprognævn har fået til opgave at lede det sprogteknologiske udvalg som er nedsat efter ønske fra kulturministeren.

Udvalget skal med udgangspunkt i et brugerorienteret perspektiv kortlægge de nuværende og fremtidige behov for at benytte dansk og andre sprog samt sproglig viden i forhold til digitale tjenester og applikationer baseret på kunstig intelligens i centrale sektorer af samfundet. Udvalget skal vurdere i hvilket omfang det vil være muligt at imødekomme disse behov under inddragelse af de relevante spillere i erhvervslivet, den offentlige sektor samt uddannelses- og forskningssektoren.

Udvalget skal afklare behovet og perspektiverne for en national termbank (”sprogtermbank”) og inddrage resultater fra arbejdet med dansk terminologi og danske vidensbaser samt med begrebs- og datamodellering i det fællesoffentlige digitale arkitektursamarbejde.

Udvalget skal inddrage relevante resultater fra arbejdet med sprogteknologi og terminologi i andre lande, herunder EU og Norden, og pege på måder hvorpå en styrkelse af dansk sprogteknologi vil kunne gavne den enkelte borger og bidrage til at skabe vækst og effektivisering i samfundet.

Udvalget består af følgende medlemmer:
CTO Klaus Akselsen, MIRSK Linguist, Partner, Head of Research and Innovation Esben Alfort, Ankiro ApS Udviklingschef Lars Fremerey, GTS-foreningen Computational Linguist Anna Katrine Jørgensen, Google Sekretariatschef Jens Kellerup, Ballerup Kommune/OS2 – (Offentligt digitaliseringsfællesskab) Direktør Sabine Kirchmeier, Dansk Sprognævn (formand for udvalget) Direktør Jens Otto Kjærum, Dictus Professor Bodil Nistrup Madsen, CBS – Copenhagen Business School Seniorredaktør Sanni Nimb, Det Danske Sprog- og Litteraturselskab Professor Bolette Sandford Petersen, Center for Sprogteknologi, Københavns Universitet Forsknings- og Innovationsdirektør Anders Quitzau, IBM Research - Watson Advocate
Founder, Chief Visionary Officer Mads Rydahl, Unsilo Kontorchef Jens Krieger Røyen, Digitaliseringsstyrelsen Chefkonsulent Carl Østergaard, Odense Kommune
FAKTA:
Dansk Sprognævn er vært for udvalget.
Arbejdet skal være afsluttet medio 2019.
Bloggen sprogtek2018.dk http://http://sprogtek2018.dk/ er udvalgets centrale informations- og debatforum.
KONTAKT:
Direktør Sabine Kirchmeier, Dansk Sprognævn, 26846370, sabine@dsn.dk.
Mere om sprogteknologi og fagsprog på dsn.dk:


Billedet er fra møde i Folketingets Kulturudvalg om sprogteknologi




Faktaboks:
Dansk Sprognævn er vært for udvalget
Arbejdet skal være afsluttet medio 2019
Bloggen sprogtek2018.dk er udvalgets centrale informations- og debatforum.

På bloggen vil der løbende blive informeret om udvalgets arbejde, lagt links og andre relevante oplysninger. Det er tanken at bloggen også skal være et af de steder hvor der indhentes kommentarer, forslag og ideer fra offentligheden.



Ingen kommentarer:

Send en kommentar