AI: Et tværgående politisk og professionelt samarbejde skal sikre dansk sprogteknologis udvikling

DEBAT: Der er behov for et tværgående politisk og professionelt samarbejde, hvis dansk sprogteknologi skal følge med den internationale udvikling, skriver Anne Bøgh Fangel og Anders Kofod-Pedersen, projektleder og vicedirektør i Alexandra Instituttet.

Af Anne Bøgh Fangel og Anders Kofod-Pedersen
Projektleder og vicedirektør, Alexandra Instituttet

Rykker Danmark hurtigt nok på dansk sprogteknologi?

Digitaliseringsstyrelsens nye platform for sprogteknologiske ressourcer på dansk er et vigtigt skridt i retningen af et større fokus på området.

Men hvis vi i Danmark skal lykkes med at bringe dansk sprogteknologi på forkant, så kan vi ikke bare sætte os med hænderne i skødet og vente på, at Digitaliseringsstyrelsen gør arbejdet for os. Vi er nødt til at bidrage til en fælles indsats.

Sprogteknologi er vigtig i digital kommunikation
Vi har i Alexandra Instituttet de seneste to år haft fokus på udviklingen af modeller inden for sprogteknologi (NLP) på dansk.

Det har vi, fordi mere og mere af vores kommunikation kommer til at foregå digitalt, og kommer vi ikke med på vognen med sprogteknologi, så kommer Danmark til at sakke bagud på digitalisering.

For mange af de digitale løsninger, vi bruger, og kommer til at bruge, har elementer af sprogteknologi, og vi risikerer at blive nødt til at anvende engelsksprogede løsninger, hvis ikke de danske værktøjer er gode nok.

Og det vil have konsekvenser for danske virksomheders muligheder for at udnytte potentialerne med kunstig intelligens.

Behov for store mængder dansksprogede data
Derfor er det godt at se, at Digitaliseringsstyrelsen sætter fokus på dansk sprogteknologi med deres nye platform, hvor de samler nogle af de ressourcer, der er på området i Danmark.

Det skaber synlighed om, hvad vi har at bygge på, men det er langt fra nok. Vi har stadig et stort arbejde foran os.  

Alle, der har arbejdet med maskinlæring og sprogteknologi, ved, at man ikke kommer ret langt uden store mængder dansksprogede data.

Så der ligger et vigtigt arbejde i at opbygge og vedligeholde basisressourcer til det danske sprog.

Lovgivningsmæssige rammer til opbygning
I dag bremses offentlige og private virksomheders udvikling af sprogteknologiske løsninger i høj grad af usikkerhed om de lovgivningsmæssige rammer.

Der er behov for politisk fokus på, hvordan lovgivningen bedst udvikles, så den på den ene side understøtter den teknologiske udvikling, men samtidig også sikrer udviklingen af ansvarlige teknologiske løsninger. 

Der er behov for, at politikerne sikrer en udvikling af de lovgivningsmæssige rammer, så det understøtter opbygningen af en fælles dansk dataressource – via for eksempel indberetningspligt, standardprocedurer for fair use og rammer for copylefting.

Og endelig er det vigtigt, at der skabes klarhed over de lovgivningsmæssige rammer, sådan at det bliver lettere at navigere i mulighederne.

Samarbejdets nødvendighed
En af de markante internationale spillere inden for Open Source NLP, Explosion.ai, har netop i sidste uge – for første gang – inkluderet dansk i deres seneste release af SpaCy.

Det er et lille skridt på vejen mod, at danske virksomheder nemmere kan udvikle dansksprogede løsninger.

Men dette opstår ikke ud af den blå luft! Bag kulissen har forskere fra IT-Universitetet lagt en stor indsats i udviklingen af datasets, og Københavns Universitet har i samarbejde med vores specialister fra Alexandra Instituttet også lavet et stort stykke arbejde.

Tidligere på året gjorde den danske startup BotXo deres danske BERT-model tilgængelig open source. En model, der vakte opsigt blandt udviklere og siden er blevet afprøvet og tilpasset af andre virksomheder.

Og senest har vi i Alexandra Instituttet open source’et de første versioner af en række nye danske BERT-modeller, der automatisk kan identificere personer, organisationer og steder i tekst samt prædiktere, hvilke følelser der kommer til udtryk på de sociale medier.

Dette har kun kunne lade sig gøre, fordi DR og Infomedia har stillet data til rådighed.

Alt dette for at understrege, at dette er et område, hvor vi i høj grad løser i flok og bidrager i fællesskab. Det er ikke bare tomme ord. Det er allerede en realitet.

Men det er også en nødvendighed, og en agenda vi er nødt til at fremme, hvis vi for alvor skal rykke dansk sprogteknologi.

En kontinuerlig udvikling af ressourcer
I Alexandra Instituttet har vi gjort 2020 til året, hvor vi sætter alle sejl ind for at styrke denne agenda.

Alene kan vi noget. Sammen kan vi meget mere.

Så vi er nødt til at få både danske politikere, dansk forvaltning, og danske virksomheder på banen. Vi er nødt til styrke rammerne for at udvikle i fællesskab.

Derfor har vi de seneste måneder arbejdet på at skabe en samarbejdsplatform, der skal være med til at sikre den kontinuerlige udvikling af ressourcer og modeller, så der også om to til tre år vil være nye og opdaterede ressourcer at finde på Digitaliseringsstyrelsens platform.

For det danske sprog udvikler sig hele tiden, og det samme gør de teknologiske muligheder. Så det er nu vi for alvor skal tage arbejdshandskerne på. Skal du være med?

Forrige artikel Lektorer: Styrk pædagoguddannelsen gennem formål, fag og frihed Lektorer: Styrk pædagoguddannelsen gennem formål, fag og frihed Næste artikel Debat: Erhvervsskoleelever er langt hårdere ramt af coronakrisen end universitetsstuderende Debat: Erhvervsskoleelever er langt hårdere ramt af coronakrisen end universitetsstuderende