Tredjeplads i Altinget og Dansk IT's debatkonkurrence: Åbenhed er nøglen til big data-succes

DEBAT: Hvis det offentlige skal få succes med at benytte data, kræver det borgernes tillid. Et system med datatransparens kan få uvedkommende til at holde sig væk. Det indebærer, at den digitale infrastruktur justeres, skriver Malthe Munkøe, der indtager tredjepladsen i Altingets debatkonkurrence.

Af Malthe Munkøe

Alle steder ser vi gevinsterne ved digitalisering og big data, og samtidig ser vi alle steder et såkaldt techlash, hvor borgere vender sig mod den måde, private firmaer systematisk har høstet og anvendt informationer om personer.

Den offentlige sektor kan høste kolossale gevinster via dataanalyse, men det kan kun ske, hvis man formår at sikre borgernes tillid igennem styrket transparens i forhold til, hvilke borgeroplysninger det offentlige tilgår, og hvorledes de anvendes.

Big data-revolutionen forudsætter tillid
Vi tænker typisk på data i den offentlige sektor som bestemte oplysninger, for eksempel cpr-nummer eller indførsler i tre ens lægeattester og straffeattester.

Nogle typer informationer betragtes som personfølsomme, for eksempel i lov om persondata, der skelner mellem personfølsomme og ikke følsomme oplysninger, og der er opbygget sikkerhedssystemer, som især søger at undgå, at uvedkommende kan få adgang til dem.

Men realiteten i dag er, at denne skelnen ikke længere er så meningsfuld, og mange oplysninger, der fremstår harmløse, reelt kan være potentielt meget personfølsomme i den rigtige big data-kontekst.

De fleste har hørt om Cambridge Analytica-skandalen, hvor et privat firma kunne benytte et smuthul i Facebooks reklamemekanisme til at høste enorme mængder data om, hvad folk havde liket, og de oplysninger, de havde opgivet om alder, politisk tilhørsforhold og lignende.

Ved at analysere denne data indså Cambridge Analytica eksempelvis i en meget omtalt finding, at tøjmærker siger meget om folks personlighed.

Derved kunne Trump-kampagnen, der benyttede Cambridge Analytica, blandt mange andre metoder angiveligt målrette sine reklamemidler på sociale medier mod personer, der havde liket kendte amerikanske brands som Wrangler – en stærk indikator for, at man i psykologisk forstand har en mindre åben personlighed og derfor var Trumps målgruppe – snarere end at spilde dem på personer, der liker udenlandske tøjmærker.

Data afslører personlige oplysninger
Baseret på datasættet fra Facebook forsøgte Cambridge Analytica således at udlede oplysninger om folks psykologiske profil, intelligensniveau, lederpotentiale, politiske holdninger, seksualitet og religion.

Pointen er, at når man tager enkeltstående statistiske datapunkter – at man kan lide Wrangler, at man har liket en Toyota-reklame, at de billeder, man uploader på sociale medier, ofte indeholder mange personer, eller mere er naturbilleder – ind i en big data-sammenhæng, kan det give overraskende indsigter om meget personlige forhold.

Udfordringen accentueres af, at disse typer indsigter bliver langt nemmere tilgængelige igennem moderne dataanalysemetoder.

Hvilke bøger man har lånt på biblioteket, kan give indsigter om en persons psykologiske træk og derfor være lige så følsomt som for eksempel cpr-nummer, helbredsoplysninger og lignende.

Det bliver en af de helt store udfordringer i den offentlige sektor at finde en vej frem, hvor vi på den ene side sørger for, at det offentlige kan høste de mange gevinster ved at udarbejde big data-analyser om borgerne, men samtidig sikrer en fornuftig privacy-beskyttelse af informationer.

Store firmaer i den private sektor har misbrugt den tillid, der er blevet vist, og resultatet ser vi nu med udsigt til strenge databeskyttelseslove og generel mistillid.

I vores demokrati er den offentlige sektor endnu mere afhængig af borgernes tillid og accept end de mange digitale firmaer, og derfor kan det offentlige kun høste de store gevinster, der ligger i big data-analyse, hvis vi finder en vej, som sikrer, at den fastholdes.

Fra dataforsvar til datatransparens
Et land, der med en baggrund i Sovjetunion, har oplevet, hvor meget det betyder, hvem der kan tilgå følsomme data om borgerne, er Estland.

Samtidig har Estland mere end noget andet land oplevet risikoen ved, at data om borgerne kommer i udenforståendes hænder, efter de massive hacker- og cyberangreb i 2007 i kølvandet på kontroverserne om et mindesmærke for en sovjet-soldat.

Siden har landet satset stort på digitalisering under overskriften e-Stonia og gået nye veje for at dæmme op for udfordringen med data og privatliv i den offentlige sektor:

Man forsøger at vende logikken om, så det ikke kun handler om at forsvare og beskytte offentlig data, men lige så meget om at skabe transparens om, hvem der har tilgået dem.

Som en interviewperson udtrykte det i The New Yorker i en special om e-Stonia, så er det ”ikke big brother, men little brother”; det er ikke den monolitiske store stat, som overvåger borgerne, men alle borgerne, der overvåger, hvad staten har lavet med deres data.

Kan den estiske tankegang om datatransparens inspirere den offentlige sektor i Danmark?

Det vil i så fald indebære, at den digitale infrastruktur justeres, så borgerne på ethvert tidspunkt kan se, hvornår deres data bliver tilgået og af hvem. Det vil være kriminelt at tilgå data, man ikke har nogen grund til at kigge på.

I stedet for kun at have et system med fokus på at holde uvedkommende ude, kan datatransparens få uvedkommende til at holde sig væk.

Databetydning handler om kontekst
Hvis et arkiv om borgerne findes i gammeldags fysisk forstand, kan ingen vide, hvem der har kigget i det. Med moderne it-systemer er der en logningsfil.

Ved at gøre disse logningsoplysninger tilgængelige for borgerne i en forståelig, ikketeknisk form kan vi komme endnu længere i bestræbelserne på at sikre den transparens og tillid, der skal til, for at det offentlige kan udnytte alle de digitale muligheder.

Men som vi har set, kan åbenhed om, hvilke bestemte data der tilgås, ikke gøre det alene.

Indtil nu har diskussionerne om privacy og data overvejende været juridisk – nogle typer data er særligt følsomme, og dem opretter vi et særligt beskyttelsessystem omkring eller forbyder registrering af.

Betydningen af data handler i stigende grad om konteksten; tilsyneladende uskyldige datapunkter kan i mange tilfælde tilsammen give en sandsynlig profilering af en person.

Og mange erkendelser er ikke åbenlyse ved første øjekast; angiveligt tog det lang tid, før det stod klart, hvor vidtrækkende indsigter Cambridge Analytica kunne få ud af simpel like-adfærd på Facebook.

Derfor vil der blive behov for løbende opmærksomhed og faste praksisser for, hvordan det offentlige er åben om de konkrete dataanalyser, der udarbejdes, og de konkrete indsigter, de leder frem til.

Forrige artikel Debat: Vi har mistet overblikket over digitaliseringen Debat: Vi har mistet overblikket over digitaliseringen Næste artikel Radikale til justitsministeren: At overvågning skaber frihed er noget vrøvl Radikale til justitsministeren: At overvågning skaber frihed er noget vrøvl
Arbejdspladsen bliver virtuel, og arbejdet bliver ”distribueret”

Arbejdspladsen bliver virtuel, og arbejdet bliver ”distribueret”

RAPPORT: At arbejde hjemmefra er måske blot en forsmag på en ny måde at organisere arbejde og virksomheder på, når man mere konsekvent bruger digitale værktøjer. Den amerikanske designer John Maeda fortæller i en ny rapport om at gå skridtet videre fra distancearbejde til distribueret arbejde.