Forskere: Varmecheck-fejl skyldes dårlig datahåndtering i den offentlige forvaltning

Caroline Howard Grøn
Teamleder for dagtilbudsteamet, Styrelsen for Undervisning og Kvalitet
Ane-Kathrine Lundberg Hansen
Data-manager, Kong Frederiks Center for Offentlig Ledelse, Aarhus Universitet
Jo flere processer i den offentlige sektor der automatiseres, jo større bliver kravene til de data, der puttes ind i processerne.
Varmechecken er et aktuelt eksempel på, at datahåndtering bør blive en ny yndlingsdisciplin blandt embedsmænd på tværs af den offentlige sektor.
Varmechecken er, kort fortalt, en kontant støtte til borgere, der er ramt af høje varmeregninger og ikke tjener mange penge. Eller det var i hvert fald ideen.
I den seneste uge har medierne været præget af historier om borgere, der har fået checken – også selvom de hverken har gasfyr, øgede varmeomkostninger eller en lav indkomst.
Den ansvarlige minister, Dan Jørgensen, har efterfølgende meldt ud, at man godt vidste, at der var udfordringer med det datagrundlag, man har brugt til at foretage udbetalingerne på baggrund af, men at man vurderede, at der var tale om meget få, der ville få checken uretmæssigt. Der var dog ikke foretaget nogen vurdering af præcist hvor få.
Sagen er illustrativ. For det første viser den, at bekymringer om datakvalitet ikke kun er en sport for forskere, men i høj grad også for embedsmænd.
Efterhånden som flere og flere processer i den offentlige sektor automatiseres, stiger behovet for medarbejdere, der har evnerne til at håndtere data og sikre, at det input, der kommer ind i de automatiserede processer, er af god kvalitet.
Hvor kommer problemerne fra?
Fejl kan komme mange steder fra. De kan komme fra, da data blev "skabt". I forskningen taler vi om, at vi renser data.
Der er altid en risiko for, at dem der indberetter data laver fejl, hvad end indberetningen foretages af borgerne selv eller for eksempel kommunale sagsbehandlere.
Caroline Howard Grøn og Ane-Kathrine Lundberg Hansen
Hhv. lektor og videnskabelig assistent, Aarhus Universitet
Det lyder fordækt, men det handler for eksempel om at gennemgå sit datasæt og se, om der er nogen svarpersoner, der ved en fejl har indberettet, at de er 250 år gamle.
Der er altid en risiko for, at dem der indberetter data laver fejl, hvad end indberetningen foretages af borgerne selv eller for eksempel kommunale sagsbehandlere.
Særligt når der er tale om data, som borgerne selv skal indberette, er der god grund til at være ekstra opmærksom på datakvaliteten.
I eksemplet med varmechecken har der været historier om boligselskaber, hvor varmeforsyningen har været registreret forkert, hvorfor beboere er blevet snydt for varmechecken.
Men fejlene kan også komme i håndteringen af data. Derfor er vi også mange, der ikke er så begejstrede for Microsoft Office-programmet Excel.
Excel er godt, hvis det bruges på den rigtige måde og til de rigtige formål. Men hvis man er bekymret for sin datakvalitet kan Excel være lidt for initiativrig.
Et godt eksempel på dette er funktionaliteten, der laver tal om til datoer. Generelt gælder det, at det er svært at holde styr på, hvem der har ændret i data, og hvornår der er blevet ændret i data.
Desuden har Excel en stor svaghed når det kommer til fejlfinding, hvor undersøgelser har vist, at det er hovedreglen, at der kan findes fejl i et Excel-ark, eftersom mange ting foretages manuelt.
Vi ved ikke, om data har været igennem Excel, men pointen er, at datahåndtering ofte også kræver manuelle processer, der er sårbare for fejl.
Det gælder også, når datakilder sammenkobles. Fejl kan opstå, når data kommer fra forskellige kilder, der ikke vil snakke sammen, eller når data skal "ommøbleres" manuelt for, at datastrukturerne bliver ens.
Det kan være svært at finde og rette fejl, og det kræver medarbejdere, der kan gennemskue, hvor der er fejl, og hvor der ikke er. Endelig er det som oftest en tidskrævende opgave.
Hastværk bliver til politisk lastværk
Hastigheden er en selvstændig pointe i forhold til udbetalingen af varmechecken. Ministerens respons indikerer, at der er tale om en kalkuleret risiko; de vidste godt, at der var problemer med data.
Ser man på offentlighedens respons på udbetalingen, sidder man tilbage med det indtryk, at ministerens accept af fejludbetalingerne ikke deles af den brede offentlighed.
Caroline Howard Grøn og Ane-Kathrine Lundberg Hansen
Hhv. lektor og videnskabelig assistent, Aarhus Universitet
Der har helt tydeligt været et trade-off mellem hensynet til at få pengene ud til borgerne og præcisionen i udbetalingerne – eller unødvendigt bureaukrati, som ministeren betegner det.
Her illustrerer sagen et reelt dilemma: på den ene side muliggør automatisering, hurtigere processer; på den anden side kommer det altså også med en substantiel fejlmargin, hvis datagrundlaget ikke er i orden.
Ser man på offentlighedens respons på udbetalingen, sidder man tilbage med det indtryk, at ministerens accept af fejludbetalingerne ikke deles af den brede offentlighed, der ikke finder det legitimt at borgere uden gasfyr får 6.000 kroner ind på kontoen.
Endelig er det væsentligt at være opmærksom på, at data, ligesom veje og togskinner, er infrastruktur, der skal vedligeholdes.
Styrelsen har taget udgangspunkt i, hvad der var registreret som varmekilde i januar 2022, og indkomstgrundlaget går helt tilbage til 2020.
Vi ved derfor, at folk der er flyttet, har fået fjernet sit gasfyr eller i dag er nået over indkomstgrænsen også har fået penge.
Forældede data er altså også på listen over potentielle fejlkilder, når de store mængder data, vi har i vores offentlige systemer skal nyttiggøres.
Vejen frem er bedre datahåndtering
Danmark er blandt verdens mest digitaliserede lande. Vi har virkelig meget data, og meget af det er også af god kvalitet. Når vi fremlægger vores forskning på internationale konferencer, ser vores kolleger på os med slet skjult misundelse.
Men ligesom vi forskere af og til må konstatere, at data ikke "ser rigtigt ud", og vi derfor må undersøge, hvordan det er indsamlet og håndteret for at være sikre på, at vi kan bruge det til vores forskning, så betyder øget digitalisering og automatisering, at de samme krav møder den offentlige forvaltning.
Bare fordi man har data, kan man ikke nødvendigvis bruge det. Og uden en tilbundsgående forståelse for, hvordan data er lavet og håndteret, kan man ende med at udbetale skattepenge til nogen, der slet ikke skulle have haft dem.
Artiklen var skrevet af
Omtalte personer
- 100 elbusser mangler strøm fra Energinet: ”Det var slet ikke noget, vi tænkte kunne blive et problem”
- Energikrise tvinger EU til "midlertidig og målrettet" støtte til sort energi
- Eksperter har givet gode råd til Energinet: Sådan foreslår de at løse problemerne med elnettet
- Dansk Erhverv: Det er absurd, at en forældet havnelov kan hugge bremsen i for solcelleanlæg
- Kommunerne bør få lov til at skabe lokal grøn elproduktion uden om anlægsrammen
Nyhedsoverblik

Dan Jørgensen opfordrer europæerne til at arbejde hjemme

Ny energikrise får europæiske ledere til at kræve grønne forringelser

Sverige truer med at kappe energikabler til Danmark

Dan Jørgensen blev overhalet af virkeligheden inden stort udspil. Nu presser lande på for billigere strøm her og nu




















