Med så många utmaningar, går det att göra något för att förverkliga den potential till ökad transparens, effektivitet, innovation och tillväxt som öppna data sägs ha?
I diskussionen kring öppna data har det tyvärr ofta funnits ett liknande resonemang. Om bara kommuner och myndigheter gör sina data fritt tillgängliga för vidareutnyttjande kommer de som vill vidareutnyttja data från offentlig sektor att flöda fram, ”if you build it he will come”. Men till skillnad från Kinsella som fick se sina drömmar komma till liv på sitt fält flödar användarna sällan till offentlig sektors öppna datasatsningar.
Det behöver bli enklare att förstå och vidareutnyttja de data som kommuner och myndigheter publicerar. Det behövs också tydligare styrning av arbetet med öppna data, ett större användarfokus samt en samordning kring vilka datamängder som ska publiceras och hur detta ska göras. Dessutom bör myndigheter och kommuner i större utsträckning automatisera publiceringen av öppna data.
Juyeon Ham med flera har studerat ett flertal nationella öppna datasatsningar och i vilken utsträckning de data som tillgängliggjorts används. Resultatet är nedslående. Oavsett om ett land publicerat många eller få datamängder så är vidareutnyttjandet svagt, på en skala från 0 till 1 är det endast ett land som når över 0,24. Österrike sticker ut från mängden och får full poäng för vidareutnyttjande av data men deras poäng för tillgängliggörande av data är låg.
Österrikes resultat förklaras av att det är efterfrågan på data som drivit utvecklingen samtidigt som myndigheterna varit långsamma eller till och med motvilliga att tillgängliggöra de data som efterfrågas. Det gör att de data som har publicerats som öppna data verkligen används. Andra länders dåliga resultat vad gäller vidareutnyttjande förklaras bland annat av att publiceringen av data styrs av centrala initiativ eller av myndigheternas tillgång till data som enkelt kan tillgängliggöras som öppna data. Detta utan att någon större hänsyn tas till vilka data som faktiskt efterfrågas eller hur data kan användas i praktiken.
I en analys av hinder för att använda myndigheternas öppna data konstaterade Statskontoret 2018 att majoriteten av de undersökta myndigheterna publicerade öppna data på ett sätt som försvårade vidareutnyttjande. Statskontoret pekade på bristande kvalitet i den metadata som beskriver de publicerade datamängderna, att det var svårt för användare att hitta myndigheternas data och att det saknades standardiserade dataformat och leveranssätt. Dessutom lyftes det fram att myndigheternas datakataloger var utformade på ett sätt som gjorde det svårt för en intresserad allmänhet att ta del av publicerade data. Myndigheternas datakataloger var inte anpassade för att kunna användas på skärmar av olika storlek, det var svårt att ta del av data direkt på webbplatsen och bra sammanställningar och bearbetningar som kunde bidra till att förstå myndigheternas data saknades.
De problem som Statskontoret lyfter fram är inte unika för Sverige. Exempelvis har Thomas Schauppenlehner och Andreas Muhar påpekat vikten av att metadata håller hög kvalitet och att det är enkelt att söka efter datamängder för att tillgången till data inte bara ska vara teoretisk utan även fungera i praktiken. Även Anneke Zuiderwijk och Marijn Janssen lyfter vikten av metadata som är lätt att förstå och sökbarheten bland de data som publiceras.
Zuiderwijk och Janssen lyfter även upp andra hinder för vidareutnyttjandet av öppna data. De pekar på att data som en gång publicerats inte hålls uppdaterade, att endast delar av en datamängd publiceras, att det är svårt att tolka data och att interagera med den som publicerat data. En studie av öppna dataanvändare i Brasilien genomförd av Rodrigo Hickmann Klein, Deisy Cristina Barbiero Klein och Edimara Mezzomo Luciano visar liknade resultat. Användarna menar att det är viktigt att det går att förstå de data som publiceras, att data är komplett och att den hålls uppdaterat. Ett annat perspektiv som lyfts fram i den brasilianska studien är att all offentliga organ publicerar ett antal datamängder som alla myndigheter har en skyldighet att publicera. Brasilien har liksom Storbritannien nationella bestämmelser om vissa datamängder som ska publiceras på ett enhetligt sätt av offentliga organ.
I en nyligen genomförd studie om hur dataportaler kan bidra till att öka öppenheten i den offentliga förvaltningen lyfter Martin Lněnička, Renata Machova, Jolana Volejníková, Veronika Linhartová, Radka Knezackova och Miloslav Hub upp sök och filtreringsfunktioner, möjligheten att välja och ladda ner data, att föreslå nya datamängder, att visualisera och interagera med publicerade datamängder samt att utforska och lära sig som de viktigaste funktionerna i en dataportal.
Men innan data hamnar i en dataportal måste den först tillgängliggöras av en kommun eller myndighet. I Statskontorets undersökning om den offentliga förvaltningens arbete med att tillgängliggöra offentlig information konstateras det att det finns stora skillnader mellan olika kommuner och myndigheter men att utvecklingen vad gäller att publicera öppna data går långsamt. Orsaken till att inte mer data görs tillgänglig för vidareutnyttjande uppges vara resursbrist, att myndigheterna saknar verktyg för att på ett enkelt sätt kunna tillgängliggöra data samt att det är svårt att identifiera relevanta datamängder.
Med så många utmaningar, går det att göra något för att förverkliga den potential till ökad transparens, effektivitet, innovation och tillväxt som öppna data sägs ha?
Jag har fyra konkreta råd. Mycket kan göras av varje enskild kommun eller myndighet men för att få ut den fulla potentialen av öppna data måste regeringen och Sveriges kommuner och regioner (SKR) ta ett större ansvar.
Juyeon Ham och medförfattare visar på vikten av att publicera datamängder som efterfrågas av användarna. De lyfter fram behovet av att myndigheter undersöker vilka datamängder användarna vil ha och hur användarnas prioriteringar ser ut. För att nå en hög grad av vidareutnyttjande av publicerade datamängder är det viktigt att de som publicerar data och de som använder de interagerar med varandra; att det finns möjligheter att komma med förslag och synpunkter och att en sådan möjlighet också tas tillvara.
Regeringen och SKR måste ta ett större ansvar för att styra och samordna arbetet med öppna data. Sverige bör, liksom Brasilien och Storbritannien, ha en lista på vissa bestämda datamängder som alla kommuner och myndigheter ska publicera på ett enhetligt sätt. Myndigheten för digitalförvaltning (Digg) bör inom sitt uppdrag att främja tillgängliggörande av öppna data och vidareutnyttjande av handlingar från den offentliga förvaltningen ges ett särskilt ansvar för att hålla samman framtagandet och förvaltningen av gemensamma specifikationer för hur olika datamängder ska publiceras.
Ett steg till att publicera datamängder på ett mer enhetligt sätt har tagits genom det Vinnovafinansierade projektet Nationell skalning öppna data (NSÖD) som drivs av Rise och där TietoEVRY är med och bidrar. I projektet tar vi bland annat fram specifikationer för olika datamängder så att kommuner och myndigheter kan publicera data på ett enhetligt sätt. Specifikationerna kan nås, tillsammans med specifikationer framtagna av andra, via den nationella dataportalen.
En del av arbetet inom NSÖD handlar om att utveckla sätt att automatisera publiceringen av öppna data. Vi på TietoEVRY har inom projektet tagit fram integrationer för att automatisera publiceringen av kommuners leverantörsreskontra som öppna data. Automationen gör det möjligt att hämta ut informationen från de ekonomisystem som vanligtvis används inom kommuner, maska eventuella personuppgifter och uppgifter som omfattas av sekretess samt publicera data på en öppna dataplattform. Publiceringen kan ske helt automatiskt eller med en manuell kontroll av datamängden innan publicering.
Att kunna automatisera delar av arbetet med öppna data är viktigt för att det ska vara långsiktigt hållbart för kommuner och myndigheter. Det arbete vi gjort inom NSÖD visar att detta är möjligt att göra.
Att publicera metadata om de data man tillgängliggör som öppna data är viktigt, men som forskningen visat är det inte tillräckligt för att skapa goda förutsättningar för vidareutnyttjande. Det behövs bra funktioner för att söka efter data och inom datamängder. Användarna måste ges möjlighet att förstå den data som publiceras genom visualiseringar. Och det behöver finnas möjligheter för användarna att interagera med den som publicerar data.
Öppna data är inte drömmarnas fält. Det är inte bara att lägga ut ett antal datamängder på webben så uppstår all den där nyttan med transparens, effektivitet, innovation och tillväxt. Det krävs att man publicerar datamängder som användarna vill och kan använda, att data publiceras på ett enhetligt sätt av flera organisationer, att man arbetar för att automatisera publiceringen av öppna data och att data publiceras med hjälp av en portal som gör det lätt för användarna att förstå och använda de publicerade datamängderna.
Min kollega Mats Hammarlund skriver mer om hur TietoEVRY kan hjälpa offentlig sektor i arbetet med öppna data.