Kronik

Rektorer: Tesfayes AI-ekspertgruppe løser ikke vores udfordringer ved eksamensbordet

Aktuelt mister eksamen i gymnasiet værdi på grund af kunstig intelligens. Mattias Tesfaye har nedsat en ekspertgruppe, men indtil videre tyder udmeldingerne på, at den ikke vil løse den vigtigste AI-udfordring, skriver fire rektorer. 

Vi kan lige nu ikke på troværdig vis vurdere en dansk stil, en matematikopgave eller et studieretningsprojekt, skriver fire rektorer. 
Vi kan lige nu ikke på troværdig vis vurdere en dansk stil, en matematikopgave eller et studieretningsprojekt, skriver fire rektorer. Foto: Mads Claus Rasmussen/Ritzau Scanpix
Henrik Boberg BæchTrine Ladekarl NellemannJacob Friis KjærgaardThomas Hyldal
Dette indlæg er alene udtryk for skribentens egen holdning. Alle indlæg hos Altinget skal overholde de presseetiske regler.

Lige nu er ungdoms- og voksenuddannelserne i en kattepine, hvor vi vurderer elevernes faglighed ud fra forholdsvis anakronistiske principper, der har svært ved at følge med tiden.

I løbet af få år vil alle de værktøjer, vi bruger til at skrive tekster med, blive udstyret med hjælpefunktioner understøttet af kunstig intelligens.

Det gælder også de værktøjer, som elever og kursister på ungdomsuddannelser bruger til at fremstille såvel fysikrapporter som engelske stile med.

Gruppens foreløbige udmeldinger tyder på, at man nok har blik for udfordringernes betydning for skolesystemet som helhed, men at man nok lander på en lidt svag mellemposition.

Henrik Bæch, Trine Ladekarl Nellemann, Jacob Friis Kjærgaard & Thomas Hyldal

I det danske uddannelsessystem har vi traditionelt lagt rigtig stor vægt på læring koblet til skriftlighed, og derfor bliver disse værktøjer den største teknologiske udfordring for uddannelsessystemet, vi vel nogensinde har mødt.

Som det er lige nu, smuldrer eksaminerne på det skriftlige arbejde, da vurderingen tager udgangspunkt i, at eleven altid selv har udført arbejdet alene og uden hjælp fra digitale værktøjer eller kunstig intelligens.

Læring, hvor skriftlighed indtager en helt ny rolle, er i sig selv svær at forstå, men udfordringens fortrop møder vi, når vi ser på de mange skriftlige prøve- og årskarakterer, som et eksamensbevis indeholder.

Mellem to stole

Hvordan kan vi med rimelighed vurdere elevers præstationer i en verden med AI?

Ministeren, Mattias Tesfaye (S), har allerede adresseret denne udfordring ved nedsættelsen af sin såkaldte “Chat GPT-gruppe”, hvor opgaven lyder at finde måder at sikre udprøvning på i en tid med AI.

Gruppens foreløbige udmeldinger tyder på, at man nok har blik for udfordringernes betydning for skolesystemet som helhed, men at man nok lander på en lidt svag mellemposition - på den ene side prøver, hvor AI er med og på den anden side prøver i et AI-vakuum, hvor ingen digitale værktøjer er med. Dermed sætter gruppen sig mellem to stole, og det er ingen tjent med.

Det løser efter vores mening ikke det væsentligste element i AI-udfordringen: Hvordan vurderer man validt elevers kompetencer i tilknytning til arbejde med produkter, hvor eleven har haft fuld adgang til AI?

Læs også

Det er jo det element, som frustrerer elever, lærere og os ledere lige nu på uddannelserne. Vi kan lige nu ikke på troværdig vis vurdere en dansk stil, en matematikopgave eller et studieretningsprojekt.

Det frustrerer eleverne, fordi de føler sig placeret midt i skærsilden, hvor ikke kun målene er uklare, men hvor det også er umuligt for dem at vurdere, hvorvidt de metoder, de tager i anvendelse, er lovlige.

Det frustrerer lærerne, da de vurderer og voterer computergenererede opgaver (altså snyd), og det frustrerer os ledere, som systemets repræsentanter, der skal dømme for og imod snyd i en forandret verden.

Et projekt der måske kan inspirere

For snart ti år siden arbejdede en række gymnasier i hovedstadsregionen sammen om et projekt under overskriften “Gymnasiet Tænkt Forfra”.

Projektet indeholdt mange delelementer, hvor et af dem var, at vi satte os for - med støtte af følgeforskning fra Københavns Universitet – at udvikle en metodisk tilgang til valid evaluering af innovative kompetencer, som blev afprøvet ved eksamensforsøg.

Kort fortalt blev innovationskompetencen konkretiseret ved fem underkompetencer (kreativitet, samarbejde, navigation, implementering og formidling), som igen blev vurderet på en række handlekompetencer, for eksempel blev navigationskompetencen målt på evnen til at håndtere viden og informationer på en funktionel måde og den kreative kompetence blev målt på evnen til selvstændigt at kunne identificere relevante problemstillinger, individuelt og i fællesskab at kunne generere forskellige ideer og/eller at kunne bearbejde og kritisk vurdere egne og andres ideer.

Handlekompetencerne blev for eksempel evalueret ud fra en række vurderingskriterier.

Følgeforskningens konklusion var blandt andet, at ”det er muligt at vurdere gymnasieelevers fagligt funderede Innovationskompetence på en pålidelig måde”, med afgivelse af en karakter.

Det vil sige, at det var muligt at vurdere elevernes innovative kompetencer parallelt med deres faglige niveau.

Sæt nu udviklingsarbejdet i gang

Det er sådan et arbejde, vi skal have i gang igen – blot i nye klæder, nu med fokus på “nye metoder til fremstilling og vurdering af faglighed i gymnasiet”.

Vi skal derfor have et grundigt forskningsstøttet udviklingsarbejde i gang ude på skolerne, hvor vi i fællesskab finder den metodik, der skal bruges for på en valid måde at vurdere elevernes skriftlige arbejde produkt, samt tilhørende valg af metode i tilknytning både til undervisningen og de skriftlige prøvesituationer, som eleverne både løbende producerer i tilknytning til undervisningen og som de i skriftlige prøvesituationer producerer.

På den måde vil vi undgå den mellemposition, som Chat GPT-gruppen lige nu synes at styre mod. Vi tror ikke på, at det vil give mening at skabe de lukkede AI-rum for prøveafvikling uden adgang til nogen former for digitale værktøjer.

Til gengæld er det afgørende, at vi får styr på evalueringer af AI-støttede produkter. Karakterer, der troværdigt selekterer eleverne på baggrund af faglige kompetencer, er nemlig lige så afgørende efter Chat GPT som før.

Karakterer, der troværdigt selekterer eleverne på baggrund af faglige kompetencer, er nemlig lige så afgørende efter Chat GPT som før.

Henrik Bæch, Trine Ladekarl Nellemann, Jacob Friis Kjærgaard & Thomas Hyldal

Og når vi nu er i gang, så er der også flere evalueringer, vi får brug for. Elevernes praksisfaglige kompetencer trænger til et tilsvarende forskningsarbejde.

Som ungdomsuddannelserne udvikler sig, og ikke mindst som gymnasiet udvikler sig, bliver der i stigende grad også behov for, at elever måles på, og får blik for, deres evner til at omsætte faglighed i praksis.

Det kræver både udvikling af indholdet i fagene, men helt sikkert også udvikling af systematik omkring evaluering af disse kompetencer. Som Gymnasiet Tænkt Forfra viste det med innovationskompetencerne, så mener vi det er muligt nu.

Hvis vi skal bevare kvaliteten af eksamensbeviserne som nationalt anerkendt og standardiseret bevis på en valid evaluering af de studerende, så bliver vi nødt til at udvikle den måde, vi evaluerer på i takt med andre udviklinger.

Det er efter vores mening et meget mere frugtbart udgangspunkt end at forsøge halvt at bevare – og indkapsle – gamle evalueringsformer og halvt bare at lade eleverne bruge AI fuldt og så samtidig bare at underlægge disse produkter den traditionelle evaluering.

Det arbejde vil vi gerne invitere til. Gymnasiet Tænkt Forfra skabte et resultat her, som er væsentligt, og vi tror på igen at kunne det, men det kræver positiv ånd, ikke mindst fra beslutningstagerne for at kunne lykkes.

Det håber vi, der findes - og vi bidrager også gerne!

Politik har aldrig været vigtigere

Få GRATIS nyheder fra Danmarks største politiske redaktion

Omtalte personer

Mattias Tesfaye

Børne- og undervisningsminister, MF (S)
murersvend (Skanska og Århus Tekniske Skole 2001)

Henrik Boberg Bæch

Rektor, Espergærde Gymnasium
cand.scient. i kemi og mikrobiologi (Roskilde Uni. 1998)

Jacob Friis Kjærgaard

Rektor, Frederiksberg VUC og STX
cand.mag. (Københavns Uni. 2002)

0:000:00