Debat

Forskere: Varmecheck-fejl skyldes dårlig datahåndtering i den offentlige forvaltning

Fadæsen omkring udbetaling af varmechecks er et eksempel på, at det kan koste statskassen dyrt, når den offentlige forvaltning ikke har styr på sine data, skriver Ane-Kathrine Lundberg Hansen og Caroline Howard Grøn.

Den ansvarlige minister Dan Jørgensen vidste godt, at der var problemer med data i forbindelse med udbetalingen af varmechecks. Men det burde der ikke have været, skriver Ane-Kathrine Lundberg Hansen og Caroline Howard Grøn.
Den ansvarlige minister Dan Jørgensen vidste godt, at der var problemer med data i forbindelse med udbetalingen af varmechecks. Men det burde der ikke have været, skriver Ane-Kathrine Lundberg Hansen og Caroline Howard Grøn. Foto: Martin Sylvest/Ritzau Scanpix
Caroline Howard Grøn
Ane-Kathrine Lundberg Hansen
Dette indlæg er alene udtryk for skribentens egen holdning. Alle indlæg hos Altinget skal overholde de presseetiske regler.

Jo flere processer i den offentlige sektor der automatiseres, jo større bliver kravene til de data, der puttes ind i processerne.

Varmechecken er et aktuelt eksempel på, at datahåndtering bør blive en ny yndlingsdisciplin blandt embedsmænd på tværs af den offentlige sektor.

Varmechecken er, kort fortalt, en kontant støtte til borgere, der er ramt af høje varmeregninger og ikke tjener mange penge. Eller det var i hvert fald ideen.

I den seneste uge har medierne været præget af historier om borgere, der har fået checken – også selvom de hverken har gasfyr, øgede varmeomkostninger eller en lav indkomst.

Den ansvarlige minister, Dan Jørgensen, har efterfølgende meldt ud, at man godt vidste, at der var udfordringer med det datagrundlag, man har brugt til at foretage udbetalingerne på baggrund af, men at man vurderede, at der var tale om meget få, der ville få checken uretmæssigt. Der var dog ikke foretaget nogen vurdering af præcist hvor få.

Sagen er illustrativ. For det første viser den, at bekymringer om datakvalitet ikke kun er en sport for forskere, men i høj grad også for embedsmænd.

Efterhånden som flere og flere processer i den offentlige sektor automatiseres, stiger behovet for medarbejdere, der har evnerne til at håndtere data og sikre, at det input, der kommer ind i de automatiserede processer, er af god kvalitet.

Hvor kommer problemerne fra?

Fejl kan komme mange steder fra. De kan komme fra, da data blev "skabt". I forskningen taler vi om, at vi renser data.

Der er altid en risiko for, at dem der indberetter data laver fejl, hvad end indberetningen foretages af borgerne selv eller for eksempel kommunale sagsbehandlere.

Caroline Howard Grøn og Ane-Kathrine Lundberg Hansen, hhv. lektor og videnskabelig assistent, Aarhus Universitet

Det lyder fordækt, men det handler for eksempel om at gennemgå sit datasæt og se, om der er nogen svarpersoner, der ved en fejl har indberettet, at de er 250 år gamle.

Der er altid en risiko for, at dem der indberetter data laver fejl, hvad end indberetningen foretages af borgerne selv eller for eksempel kommunale sagsbehandlere.

Særligt når der er tale om data, som borgerne selv skal indberette, er der god grund til at være ekstra opmærksom på datakvaliteten.

I eksemplet med varmechecken har der været historier om boligselskaber, hvor varmeforsyningen har været registreret forkert, hvorfor beboere er blevet snydt for varmechecken.

Men fejlene kan også komme i håndteringen af data. Derfor er vi også mange, der ikke er så begejstrede for Microsoft Office-programmet Excel.

Excel er godt, hvis det bruges på den rigtige måde og til de rigtige formål. Men hvis man er bekymret for sin datakvalitet kan Excel være lidt for initiativrig.

Et godt eksempel på dette er funktionaliteten, der laver tal om til datoer. Generelt gælder det, at det er svært at holde styr på, hvem der har ændret i data, og hvornår der er blevet ændret i data.

Desuden har Excel en stor svaghed når det kommer til fejlfinding, hvor undersøgelser har vist, at det er hovedreglen, at der kan findes fejl i et Excel-ark, eftersom mange ting foretages manuelt.

Vi ved ikke, om data har været igennem Excel, men pointen er, at datahåndtering ofte også kræver manuelle processer, der er sårbare for fejl.

Det gælder også, når datakilder sammenkobles. Fejl kan opstå, når data kommer fra forskellige kilder, der ikke vil snakke sammen, eller når data skal "ommøbleres" manuelt for, at datastrukturerne bliver ens.

Det kan være svært at finde og rette fejl, og det kræver medarbejdere, der kan gennemskue, hvor der er fejl, og hvor der ikke er. Endelig er det som oftest en tidskrævende opgave.

Hastværk bliver til politisk lastværk

Hastigheden er en selvstændig pointe i forhold til udbetalingen af varmechecken. Ministerens respons indikerer, at der er tale om en kalkuleret risiko; de vidste godt, at der var problemer med data.

Ser man på offentlighedens respons på udbetalingen, sidder man tilbage med det indtryk, at ministerens accept af fejludbetalingerne ikke deles af den brede offentlighed.

Caroline Howard Grøn og Ane-Kathrine Lundberg Hansen, hhv. lektor og videnskabelig assistent, Aarhus Universitet

Der har helt tydeligt været et trade-off mellem hensynet til at få pengene ud til borgerne og præcisionen i udbetalingerne – eller unødvendigt bureaukrati, som ministeren betegner det.

Her illustrerer sagen et reelt dilemma: på den ene side muliggør automatisering, hurtigere processer; på den anden side kommer det altså også med en substantiel fejlmargin, hvis datagrundlaget ikke er i orden.

Ser man på offentlighedens respons på udbetalingen, sidder man tilbage med det indtryk, at ministerens accept af fejludbetalingerne ikke deles af den brede offentlighed, der ikke finder det legitimt at borgere uden gasfyr får 6.000 kroner ind på kontoen.

Endelig er det væsentligt at være opmærksom på, at data, ligesom veje og togskinner, er infrastruktur, der skal vedligeholdes.

Styrelsen har taget udgangspunkt i, hvad der var registreret som varmekilde i januar 2022, og indkomstgrundlaget går helt tilbage til 2020.

Vi ved derfor, at folk der er flyttet, har fået fjernet sit gasfyr eller i dag er nået over indkomstgrænsen også har fået penge.

Forældede data er altså også på listen over potentielle fejlkilder, når de store mængder data, vi har i vores offentlige systemer skal nyttiggøres.

Vejen frem er bedre datahåndtering

Danmark er blandt verdens mest digitaliserede lande. Vi har virkelig meget data, og meget af det er også af god kvalitet. Når vi fremlægger vores forskning på internationale konferencer, ser vores kolleger på os med slet skjult misundelse.

Men ligesom vi forskere af og til må konstatere, at data ikke "ser rigtigt ud", og vi derfor må undersøge, hvordan det er indsamlet og håndteret for at være sikre på, at vi kan bruge det til vores forskning, så betyder øget digitalisering og automatisering, at de samme krav møder den offentlige forvaltning.

Bare fordi man har data, kan man ikke nødvendigvis bruge det. Og uden en tilbundsgående forståelse for, hvordan data er lavet og håndteret, kan man ende med at udbetale skattepenge til nogen, der slet ikke skulle have haft dem.

Politik har aldrig været vigtigere

Få GRATIS nyheder fra Danmarks største politiske redaktion

Omtalte personer

Caroline Howard Grøn

Lektor, Kronprins Frederiks Center for Offentlig Ledelse, Institut for Statskundskab, Aarhus Universitet
cand.scient.pol, ph.d., (Københavns Uni)

Ane-Kathrine Lundberg Hansen

Videnskabelig assistent, Institut for Statskundskab, Aarhus Universitet
cand.scient.pol (Aarhus Uni. 2019)