Debat: Forskere bør dele oprydningsnøgler for sundhedsdata

DEBAT: Det er tidskrævende at rydde op i datasæt fra danske sundhedsregistre. Bevillingsgivere kunne stille krav om deling af oprydningsnøgler, så forskere ikke igen og igen skal skabe orden i data, skriver Sanne Marie Thysen og Henrik Ullum.

Af Sanne Marie Thysen og Henrik Ullum
Hhv. ph.d., formand for Lægeforeningens forskningsudvalg og professor, formand for Lægevidenskabelige Selskaber

Danmarks registre med sundhedsdata er guldgruber for forskere og en stor ressource til at forbedre sygdomsforståelse og forbedre patientbehandlinger i Danmark.

På papiret er der ultrakort fra forskningsidé til forskningsresultat, men helt så simpelt er det ikke i virkeligheden.

Det kræver en del tid og kræfter at få adgang til data og komme i gang med forskningsprojektet.

Oprydning i data tager tid
Hvis man for eksempel skal bruge data, man ikke tidligere har kigget på, er der mange ”faldgruber” i brugen af data, der tager lang tid at rydde op i - blandt andet datamangler.

Det første skridt, som nogle gange kan tage mange måneder, er derfor at ”rydde op” i de udvalgte data, dvs. bygge oprydningsnøgler i form af scripts og algoritmer, der retter op på de fejl og mangler, som data indeholder.

Herefter bliver oprydningsnøglerne hos den enkelte forsker eller forskergruppe, og næste forsker, som vil undersøge noget på samme data, må altså på ny fortage denne oprydning.

Set med samfundets briller virker det forkert, at vi bruger lang tid på at udvikle scripts og algoritmer til at rydde op i data – igen og igen.

Det bremser forskningsprocessen og besværliggør både ny forskning og efterprøvelsen af resultater fra andre forskere, der har kigget på samme datasæt.

Derfor er det måske ved at være tid til at spørge, om det giver mening, at oprydningsalgoritmerne bliver hos forskerne og ikke er tilgængelige? Kan vi blive bedre til at ”rydde op i fællesskab”?

Stil krav om deling af oprydningsnøglen
Et skridt i den rigtige retning kunne være, at offentlige og private bevillingsgivere i højere grad stiller krav om, at den oprydning, der bliver udført som led i bevillingen, skal deles med andre forskere.

Samlet set vil det betyde, at forskningspengene bruges mere effektivt, og at bevillingsgiverne får mere forskning for pengene.

Man kan hente inspiration til dette fra udlandet, for eksempel ved at se på hvordan bevillingsgivere som Wellcome og UK Biobank beder forskerne bidrage til at få mest muligt ud af forskningsmidlerne ved at dele oplysninger og skabe gennemsigtighed i forskningsprocessen.

Vi kan og skal selvfølgelig ikke på samme måde dele selve de danske registerdata, idet adgangen skal være nøje reguleret af hensyn til datasikkerhed og borgernes beskyttelse.

Til gengæld kan vi uden problemer dele oprydningsalgoritmerne og den statistiske kode. På den måde kan forskere både kontrollere hinandens resultater og bygge videre på forskningen.

I dag opfinder vi ”den dybe tallerken” igen og igen.

Vi opfordrer derfor til, at vi sammen bliver bedre til at dele oprydningsnøgler for at gøre vejen fra forskningsidé til implementering kortere og få mere ud af forskningspengene.

Forrige artikel Konsulent: De mange it-skandaler kan ikke tilskrives dårlig forvaltning Konsulent: De mange it-skandaler kan ikke tilskrives dårlig forvaltning Næste artikel Debat: Fleksible udbud kræver tillid mellem ordregiver og tilbudsgiver Debat: Fleksible udbud kræver tillid mellem ordregiver og tilbudsgiver