NIEUWS

10 Uitdagingen voor Open Data


Zes jaar geleden deed Tim Berners Lee een oproep voor meer ‘raw data’. Criticasters wijzen vaak naar de beperkte en niet-zichtbare resultaten en het gebrek aan publiekelijke bewustzijn rond open data. Maar tegelijkertijd is er in de afgelopen jaren een hoop gebeurd. De vraag is wat open data nu nog tegenhoudt en welke uitdagingen opgepakt moeten worden om dit te veranderen? Lees meer over de ontwikkelingen rond open data in Nederland en waar wij denken dat er kansen liggen.

uitdaging-groot

Publieke organisaties

In 2014 werden we verrast door de snelle adoptie van open data op zowel de beleidskant als door de uitvoering van pragmatische experimenten, met name in de hoek van de centrale overheden. Zo waren de Algemene Rekenkamer, de Tweede Kamer, het RDW, het CBS, DUO en het Kadaster, druk bezig met het onderwerp open data.

In het buitenland zagen we vergelijkbare ontwikkelingen zoals bij de Wereldbank welke voortbouwde aan open data en Frankrijk die eindelijk lid werd van het OGP, en bijvoorbeeld voorheen betaalde Kamer van Koophandel informatie die vrij kwam als open data België en Bulgarije. Wat zijn bij publieke organisaties dan nu nog de obstakels?

1. Lokale overheden worstelen nog steeds

Lokale overheden lijken nog steeds te worstelen met open data. Ze falen bij het implementatie van technologie voor de ontsluiting van open data, ze zijn niet in staat om relevante data te identificeren, en ze zien ook niet (genoeg) relevante toepassingen op basis van hun open data. Begin 2014 hebben wij  24 gemeenten in Nederland gevonden welke experimenteerde met open data  (d.d.: 26-01-2015), maar vrijwel geen een kan de impact hiervan laten zien, en slechts enkelen leveren nu nog duurzaam open data.

2. Betaalde data: een groot probleem

Vanuit internationaal perspectief zijn al lang de meest waardevolle datasets, zoals data van of over het weer, mobiliteit, bedrijven en kadastrale data geïdentificeerd, maar veel landen worstelen met het open maken van deze data, omdat het geld oplevert voor de overheid. Zo is er in Nederland bijvoorbeeld van zowel de Kamer van Koophandel als het Kadaster nog een hoop data verstopt achter een betaalmuur. Nederlandse overheden staan hier niet alleen in. Andere voorbeelden zijn de Canadese beleggingsaanvragen en bedrijvenregistraties in Hong Kong.

3. Geen community, ontwikkelaars of stimuli voor hergebruik

Slechts enkele overheden zien communicatie met ontwikkelaars en technische ondernemers als een onderdeel van hun Open Data strategie. Vergeten te communiceren met deze doelgroepen is een grote gemiste kans. Er zijn immers genoeg voorbeelden die het belang ervan aantonen. Het Nederlandse kentekenregister (RDW) weet dit heel simpel, maar succesvol, te realiseren door een mailinglist aan te bieden en zo actief in gesprek te gaan met de community. Het Nederlandse Kadaster betrekt diverse vertegenwoordigers van ontwikkelaarsgemeenschappen bij hun gebruikersgroepen die werken met Geo data.

Particuliere organisaties

De 12.204 API’s op de website programmable web laten de kansen zien die openheid het bedrijfsleven en not-for-profit organisaties biedt. Interesse in open data en big data beperkt zich niet langer tot de grote tech bedrijven of startups. Grote bedrijven en MKB verkennen ook steeds vaker de mogelijkheden van open’heid’. Zo hebben zeven Nederlandse multinationals samen de Dutch Open Hackathon georganiseerd.

4. Duurzaam ondernemen nog niet daar

Lukt het bedrijven om hun zakelijk belang in lijn te krijgen met de mogelijkheden die open data kunnen brengen, dan kan het veel opleveren. Terwijl duurzaam ondernemen een steeds belangrijker (vast) onderdeel wordt van publieke bedrijven, zien nog te weinig particuliere organisaties de mogelijkheden om data over producten, processen en supply chains (leveranciers, grondstoffen) vrij te geven.

5. Geen gestructureerde aanpak

Een gestructureerde aanpak voor open’heid’ lijkt zich vooralsnog te beperken tot de Amazons, Googles, Facebooks and Microsofts. Zij hebben vaste afspraken en interne spelregels over data (Bij Google kun je als ‘klant’ altijd jouw data terugkrijgen) en een API als vast onderdeel van nieuwe of herziene producten.

Hoog in de boom werden bij deze organisaties strategieën ontwikkeld om derden te betrekken bij hun API’s, hun bedrijfsbelang of zelfs bij bedrijfsdoelstellingen. Er wordt gewerkt met data of API evangelisten. Er worden evenementen georganiseerd en er zijn incentives om openheid een succes maken. Andere bedrijven dan deze tech-organisaties, groot en klein, kunnen ook van zulke strategieën profiteren.

Onderwijs en onderzoek

Terwijl het onderzoeksveld rond open data volwassen wordt, beweegt het onderwerp van technische uitdagingen (Linked Open Data standards, big data analytics) naar nieuwe onderzoeksgebieden in de Economie of bijvoorbeeld Taal- en  Sociale wetenschappen. Maar open data kun je niet alleen onderzoeken, het zou als wetenschappelijk instrument kunnen fungeren.

6. De kans Open Access is gemist

Alhoewel open access (het vrij toegankelijk beschikbaar maken van actuele wetenschappelijke informatie) flink aan populariteit wint, gaat de meeste aandacht uit naar gratis journals en open licenties op publicaties. Wij denken dat er een enorme kans ligt bij het openen van wetenschappelijke data en deze bijvoorbeeld te bundelen met wetenschappelijke publicaties. In Nederland kunnen wetenschappers hun data publiceren via Data Archiving and Networked Services (DANS), maar deze data zit nog steeds achter een log-in, vaak voorzien van misplaatste licentievormen die verdere verspreiding hinderen.

Een open wetenschap zou meer moeten zijn dan enkel open access. Er zijn nieuwe mogelijkheden ontstaan voor waardevolle bijdragen vanuit het wetenschappelijke veld die voorbij de traditionele vormen van publicaties gaan. GEOPS  is daar een voorbeeld van. Deze tool geeft een up-to-date datavisualisatie van real time openbaar vervoersdata, wereldwijd.

Deze aanpak beperkt zich natuurlijk niet tot datavisualisaties. Wetenschappers kunnen data ook vrij maken, niet enkel voor zichzelf, maar ook voor anderen. Ze kunnen data bundelen, verfijnen en integraal delen met publieke API’s en de software die ze gemaakt hebben publiceren als open source. Ook kunnen ze een code-bijdrage leveren aan een open source project, of verbeteringen aanbrengen.

7. Linked Open Data schadelijk

De academische standaarden voor datapublicaties zijn enorm hoog. Dit vertraagt en hindert de publicatie van open data, omdat het zo complex wordt. Volgens onderzoek hebben Linked Open Data (LOD) webservices een gemiddelde downtimes van 1,5 dagen per maand! Voor commerciële toepassing is dit simpelweg onacceptabel.

Daarnaast zijn weinig ontwikkelaars goed bekend met Linked data standaarden zoals RDF, SPARQL and OWL. De meeste serieuze APIs draaien op eenvoudige, maar zeer effectieve   standaarden als REST en JSON. En ja, in deze context zijn JSON-LD and LOD fragments zeer gewaardeerde lichtpuntjes om Linked Things makkelijker te maken.

8. Te weinig onderzoek naar de impact

Er zijn verschillende economische impactstudies naar open data uitgevoerd. Dit gebeurt vooral door consultancy bedrijven en niet door academici. Ook hebben de meeste studies enkel een macro-economisch perspectief. Dit is niet erg, maar deze studies baseren zich erg beperkt op de micro-economische kant van de gevolgen van open data. Onzuivere meetinstrumenten en valse aannames krijgen vrij spel omdat er geen validatie met de praktijk is.

De Universiteit van Wageningen heeft samen met het Kadaster een rapportage uitgebracht over de effecten van het aanbieden van de Basisregistratie Topografie (BRT) als open data op micro niveau. Particulieren, maar ook het bedrijfsleven ging aan de slag met productontwikkeling op basis van de data. Het geschatte economische effect van die productontwikkeling is tenminste € 9 miljoen per jaar.

Wij denken dat deze aanpak erg geschikt is om specifieke datasets te evalueren. Meer academische studies (en verdere ontwikkeling van het instrument) zijn enorm welkom.

Open Data industrie

In het open data veld zijn er diverse duurzame  instrumenten gevonden die herhaaldelijk (en succesvol) ingezet kunnen worden. Voorbeelden hier van zijn: Open Culture Data Masterclasses (2012, 2013, 2014, 2015) , de Global Open Data Index en nieuwe tactieken zoals €˜Massaal data aanvragen. Open Corporates en Open Street Map zetten hun groei voort in datavolume, kwaliteit en impact. Daarnaast ontstaan er stromen van nieuwe toepassingen op (in Nederland open) domeinen als mobiliteit en publiek transport, zoals  RouteradarRoudle, Filepret, Fileindex. Allen zijn gebaseerd op nationale wegenkaarten en real time verkeersdata.

9. Technische barrières voor overheden

Basale technische componenten zoals datastores en datacatalogi zijn nog steeds niet makkelijk in te zetten door kleinere overheden. Lokale IT leveranciers ontberen deze functionaliteit in hun ICT aanbod, UVS gebaseerde cloud leveranciers kunnen EU overheden voor een dilemma zetten, en mondiale leveranciers zijn vaak te duur voor kleine overheden.

10. Lokale data schaalt niet

De voorbeelden van lokale overheidsdata welke tastbare waarde creëren is gering. Er is weinig casuïstiek hierover, maar zowel experts als ambtenaren blijven benadrukken dat lokale overheden op gouden databergen zitten. In de praktijk hebben mensen heel weinig contact met hun overheid. Je kunt je afvragen hoe groot de daadwerkelijke vraag is naar overheidsinformatie en of de marktkansen wel goed zijn ingeschat.

Tegelijkertijd blijven overheden gebruik maken van archaïsche manieren van communiceren met de bevolking: lokale suffertjes, post en e-mail. Communicatie kanalen welke relevante informatie aanbieden maar niet in een vorm die toepassing toe laat. Wij denken dat dit soort data met name  voor het publiek interessant zijn.

Verder praten?

Deze tien uitdagingen zijn er om getackeld te worden. We zijn ook benieuwd hoe jij dat ziet. Laat het ons weten via Twitter (@OpenStateEU).