Debat

Professor: Opgaverne i de nationale tests er noget skrammel

DEBAT: De nationale tests styrke er, at man kan sammenligne resultater, men det kræver, at opgaverne lever op til en række kvalitetskrav. Det gør de ikke nu, skriver professor Peter Allerup.

Når elever i  2. og 4. klasse skal forholde sig til ord som ’palindrom’ og ’merskumspibe’, mister de modet. Her er det elever fra 3. klasse på Ellekærskolen i Aarhus. 
Når elever i  2. og 4. klasse skal forholde sig til ord som ’palindrom’ og ’merskumspibe’, mister de modet. Her er det elever fra 3. klasse på Ellekærskolen i Aarhus. Foto: /ritzau/Rasmus Baaner
Signe Løntoft
Dette indlæg er alene udtryk for skribentens egen holdning. Alle indlæg hos Altinget skal overholde de presseetiske regler.

Af Peter Allerup
Professor, Danmarks Institut for Pædagogik og Uddannelse

I den sidste tid har vi, igen, lyttet til kritiske røster om de nationale tests.

Forskere har bragt på banen, at testene er for upræcise, godt støttet af en testrunde i Norddjurs Kommune, hvor eleverne blev vurderet helt forskelligt ved de to på hinanden følgende tests med kort mellemrum.

Dertil kommer lærere, som ud fra deres erfaringer med testen synes, at opgaverne er for svære, at eleverne taber modet, og at en læseprøve til 2. og 4. klassetrin ikke bør udsætte børnene for ord som ’palindrom’, ’merskumspibe’, ’dorsk’ og flere af samme slags.

Man kan ikke have opgaver med i banken, som virker relativt lettere for drenge end for piger, eller virker lettere for elever med dansk sproglig baggrund i forhold til elever med anden etnisk baggrund.

Peter Allerup
Professor

Jamen, anfører en repræsentant fra Undervisningsministeriet, som har ansvar for de nationale tests, der skal jo være rigtig-rigtig svære ord i opgavebanken til de elever, som er rigtig-rigtig dygtige til at læse. Det drejer sig jo om højst 10 procent af eleverne, der bliver udsat for sådanne. Alle andre elever holder sig i de lavere luftlag, rent sværhedsgradsmæssigt, fordi testen løbende tilpasser opgavernes sværhedsgrad til eleven, baseret på de foregående svar. De er adaptive, som man kalder dem.

Sammenlignelighed er nøgleordet
De nationale tests er konstrueret ud fra nogle matematisk-statistiske modeller, som repræsenterer en mulighed for at sammenligne elevers præstationer, som om de blev målt med en fast tommestok. Derved bliver det muligt at sammenligne testresultater fra år til år, på samme skala, følge elevernes udvikling og foretage internationale sammenligninger, sådan som det for eksempel tænkes gjort ved PISA-undersøgelserne. Sammenlignelighed er kodeordet for at forstå, hvorfor kernen i de nationale tests er som at køre i en limousine. En evne til sammenlignelighed, som oven i købet kan kontrolleres ved statistisk analyse.

Men limousiner skal have noget at køre på, og det er i dette tilfælde de opgaver, som ligger i opgavebanken. Opgavebanken er benzintanken. Er opgaverne ikke gode nok, falder sammenligneligheden mellem elever og ved gentagne målinger væk.

Ikke to elever får samme opgaver
Testen administreres adaptivt, og der er derfor ikke to elever i en klasse, som får de samme opgaver. Sammenligneligheden er følgelig helt afhængig af, at deres besvarelser kan vurderes på én fælles skala.

Er opgaverne dårligt udformede, giver beregninger af elevdygtigheden ikke mening, og resultaterne falder ud på en måde, som afhænger af de konkrete opgaver, eleven har fået – helt i modstrid med de intentioner, der ligger omkring de generelle krav til sammenlignelighed, hvor opgaverne kun er til stede via deres sværhedsgrad, ikke deres indhold.

Opgaverne er for dårlige
Man kan ikke have opgaver med i banken, som virker relativt lettere for drenge end for piger, eller virker lettere for elever med dansk sproglig baggrund i forhold til elever med anden etnisk baggrund. Det stiller store krav til opgaverne, og i tilfælde af, at kravene ikke kan indfris, bør opgaverne tages ud af banken.

Derfor er det ikke så underligt, at der er elever, der får forskellige resultater ved gentagne tests, eller at nogle elever synes, at opgaverne er svære, selvom testen altid starter ’i midten’ rent sværhedsmæssigt. Opgaverne er ganske enkelt for dårlige – noget skrammel! Og de bliver ikke bedre af, at man medtager ord som ’palindrom’, hvis eneste funktion er at få de påståede 10 procent rigtig dygtige elever til at knække nakken og svare forkert.

Princippet bør fastholdes
Alt dette ændrer ikke på, at de principper om sammenlignelighed, som er limousinen og det teoretiske grundlag bag ved metoderne til beregning af elevdygtighederne, bør fastholdes.

Når eleven besvarer et antal opgaver med et simpelt rigtigt/forkert–resultat, kan alle med lidt kendskab til matematisk statistik nemt fastlægge, hvor usikker den endelige beregning af elevens dygtighed er. Det adaptive princip sikrer, at man opnår den ønskede tilstand, hvor eleven svarer rigtigt på 50 procent af de stillede opgaver hurtigere eller langsommere i testforløbet, afhængig af den konkrete elev.

Under alle omstændigheder er det nemt at skrue på den faktor, som har størst indflydelse på usikkerheden: Antallet af stillede opgaver. Men en sådan udregning ved hjælp af limousinen kræver, at der er tale om opgaver, som tillader den krævede sammenlignelighed – og ikke bare er noget skrammel.

Palindrom er meningsløst
Den bundne opgave til de personer, der laver opgaver til opgavebanken, er, at de blandt andet skal medtage læseopgaver, som er meget, meget svære for eleverne.

’Merskumspibe’ er svært for elever fra 2. og 4. klassetrin, uden tvivl, men en dygtig læser genkender ’pibe’ og kan måske regne ud, at ’merskum’ er det stof, piben er lavet af. Så langt, så godt – eller svært. Men ’palindrom’ har intet med læsning i 2. og 4. klasse at gøre, og for elever på disse klassetrin, også de dygtige, ligger ordet lige så langt ude i verdensrummet som skrammel fra  udbrændte raketter, der bare er der, men ikke kan bruges til noget som helst

 

Politik har aldrig været vigtigere

Få GRATIS nyheder fra Danmarks største politiske redaktion

Omtalte personer

Peter Allerup

Professor emeritus, i pædagogisk statistik (psykometri), Danmarks Institut for Pædagogik og Uddannelse
cand.stat. (Københavns Uni. 1970)

0:000:00