Debat

AI-rådgiver: Hvis ikke vi udvikler danske AI-modeller, bliver dansk yderligere marginaliseret som sprog

AI-modeller og digital sprogteknologi, der er skræddersyet til Danmark, vil give os bedre kontrol over vores data og gøres os mindre afhængige af udenlandske selskaber. Hvis ikke vi griber chancen og udvikler egne modeller, risikerer vi, at vores sprog bliver yderligere marginaliseret, skriver Jeppe Klitgaard Stricker.

Ved at udvikle vores egne avancerede sprogteknologier bliver vi mindre afhængige og sikrer bedre kontrol over vores data, skriver Jeppe Klitgaard Stricker.
Ved at udvikle vores egne avancerede sprogteknologier bliver vi mindre afhængige og sikrer bedre kontrol over vores data, skriver Jeppe Klitgaard Stricker.Foto: Florence Lo/Reuters/Ritzau Scanpix
Dette indlæg er alene udtryk for skribentens egen holdning. Alle indlæg hos Altinget skal overholde de presseetiske regler.

I torsdags skabte Mads Henrichsen, en ihærdig og passioneret enkeltperson, et lille stykke danmarkshistorie. Mads har nemlig lanceret en dansk generativ sprogmodel ved navn DanskGPT. Initiativet kan måske umiddelbart virke som en regibemærkning i den større kontekst af generativ AI, men det er det ikke. Det er et vigtigt bidrag til en meget større samtale.

De seneste års udvikling inden for kunstig intelligens og sprogteknologi har gjort det muligt at træne computere til at forstå og generere menneskeligt sprog på et niveau, der for blot få år siden var utænkeligt. Som de fleste vil vide, drives udviklingen i stor udstrækning af store amerikanske tech-giganter som Google, Facebook, OpenAI, Microsoft og Amazon på enorme sprogmodeller, der er trænet på primært engelsksproget data i en størrelsesorden af milliarder af sætninger.

Når tech-giganternes modeller arbejder med og på det danske sprog begår de en række forskellige fejl, fordi de ikke forstår sproget eller den danske kultur i tilstrækkelig grad

Jeppe Klitgaard Stricker
AI-rådgiver, tidligere chef på Aalborg Universitet og University College Nordjylland.

Når tech-giganternes modeller arbejder med og på det danske sprog begår de en række forskellige fejl, fordi de ikke forstår sproget eller den danske kultur i tilstrækkelig grad. Fordi de store datasæt primært er på engelsk, bliver de engelsksprogede modeller bedre og bedre, mens mindre sprogområder som dansk risikerer at sakke bagud i udviklingen.

Der er brug for danske AI-modeller
For et lille sprogområde som Danmark kan den globale udvikling inden for kunstig intelligens få store konsekvenser for fremtidsudsigterne med generativ AI – ikke mindst på uddannelsesområdet. 

Det diskuteres nu herhjemme på politisk niveau, om vi bør indrette os med AI-modeller skræddersyet til det danske samfund. Sverige er længere fremme end Danmark på AI-området for så vidt angår arbejdet med en national model, men også i Danmark er der en spirende interesse hos eksempelvis Kommunernes Landsforening og ATP, der ser det som et prioriteret område med behov for investeringer.

Fra et uddannelsesperspektiv er det en virkelig god idé med en sådan dansk løsning. En ting er at blive uafhængig af udenlandske kommercielle interesser, men mindst lige så vigtigt for uddannelsessektoren er det, at vi som samfund kan indrette os med generativ AI på måder, der er sikre, stabile og tager højde for dansk kultur og det danske sprog.

Uddannelsesinstitutionerne herhjemme står over for at skulle forholde sig strategisk og praktisk til generativ AI, og jeg er overbevist om, at opgaven ville synes mere overskuelig mange steder, hvis der var udsigt til en danskbaseret national sprogmodel, hvor datasikkerhed såvel som indhold var i trygge hænder.

En ting er at blive uafhængig af udenlandske kommercielle interesser, men mindst lige så vigtigt er det, at vi som samfund kan indrette os med generativ AI på måder, der er sikre og stabile

Jeppe Klitgaard Stricker
AI-rådgiver, tidligere chef på Aalborg Universitet og University College Nordjylland.

Bedre kontrol over data og mindre afhængig
I forhold til indholdsdelen er det en pointe i en stadig mere globaliseret verden, at der er forskel på, om en sprogmodel er baseret på Grundtvig, Bamses Billedbog, Niels Bohr, Asger Jorn og det danske realkreditsystem, eller om sprogmodellen primært kender til the Simpsons, George Washington, Thanksgiving og baseball. Det ene er ikke bedre end det andet, men det er to vidt forskellige kontekster at producere viden og uddannelse i.

En model der er trænet på store mængder dansk tekst og tale vil have en langt større præcision i at forstå og generere korrekt dansk, og vi vil eksempelvis kunne bygge fagspecifikke chatbots til bestemte formål ved at træne sprogmodellen på domænespecifikke data.

Det er ikke ligegyldigt, om jurastudiet i forhold til generativ AI fokuserer på dansk retspraksis og danske domme. Det er heller ikke ligegyldigt, at markedsanalyser og lignende baserer sig på en dansk kontekst. Pointen er, at chatbots og diverse andre digitale assistenter skal kunne forstå dansk fagsprog og terminologi indgående, så udnyttelsen af teknologien bliver optimal inden for forskellige fagretninger.

Jo mere vi overlader vores digitale infrastruktur til store udenlandske selskaber nu, desto vanskeligere bliver det at ændre kurs i fremtiden. Ved at udvikle vores egne avancerede sprogteknologier bliver vi mindre afhængige og sikrer bedre kontrol over vores data.

Jo mere vi overlader vores digitale infrastruktur til store udenlandske selskaber nu, desto vanskeligere bliver det at ændre kurs i fremtiden

Jeppe Klitgaard Stricker
AI-rådgiver, tidligere chef på Aalborg Universitet og University College Nordjylland.

Vi skal op i et helt andet gear 
Fra et uddannelsesperspektiv vil det således klart være at foretrække, at vi i Danmark proaktivt og uden tøven indtager førerpositionen inden for digital sprogteknologi - på dansk. Det kræver handling og vilje til at investere ambitiøst i fremtiden. 

Hvis ikke vi selv griber chancen, så er risikoen, at vores sprog bliver yderligere marginaliseret i en digital tidsalder styret af engelsk og store tech-selskaber. Det kan få konsekvenser for vores uddannelsessystem og dermed samfundet som helhed.

Sådan behøver det ikke at gå, hvis vi handler klogt.

Al ære og respekt til Mads Henrichsen for den kæmpe indsats med DanskGPT, og stort tillykke med lanceringen. Men som samfund skal vi altså op i et helt andet gear end en enkelt privatpersons store vejvilje. Og det er nu, vi skal i gang.

Læs også

Politik har aldrig været vigtigere

Få GRATIS nyheder fra Danmarks største politiske redaktion


0:000:00