Open data, maar dan beter

Author
Job Spierings

Waarom heeft Waag de CitySDK API ontwikkeld? Overheden spannen zich sinds enige jaren in om verzamelde informatie en data beschikbaar te maken voor bredere toepassing. Van stadsdeel tot rijksoverheid en de Europese Unie: elk produceert een enorme diversiteit aan data. De plantsoenendienst heeft gegevens over alle Iepen in Amsterdam, onderwijsinspectie en gemeente hebben gegevens over prestaties van scholen, en DIVV meet de doorstroomtijden op de hoofdwegen van Amsterdam. Al deze gremia verzamelen data met hun eigen doelen en middelen, van hun eigen specifiek haarvat van de samenleving.

Het resultaat is dat in heel Europa op duizenden gemeentelijke websites grote lijsten met beschikbare datasets verschijnen. Een enorme stap, vooral ook uit democratisch en ambtelijk perspectief. Maar voor wie aan de slag wil met deze datasets stapelen de problemen zich op. Verschillende bestandsformaten, verversingstermijnen (eens per week of eens per drie jaar?), data-eigenaren die hun dataset zonder aankondiging verplaatsen (naar een 'betere' website) en iedereen meet en registreert weer op zijn geheel eigen manier. 

Een voorbeeld. De gemeente Amsterdam meet met camera's wat de snelheid is van het verkeer op de hoofdwegen in de stad. Deze data worden door de DIVV intern gebruikt voor verkeersmanagement en -analyse en sinds najaar 2012 zijn deze gegevens beschikbaar als open data. Logisch zou zijn als je van een hoofdweg waar je bent of waar je naar toe gaat kunt opvragen wat daar de huidige snelheid is van het verkeer. Dan weet je of het druk is, er een file staat of dat je kan doorrijden. 

Het databestand geeft alleen snelheid en een geolocatie, dus de waarden moeten nog worden gekoppeld aan een wegsegment en rijrichting. Maar toen onze ontwikkelaars de doorstromingsdata op een kaart van Amsterdam legden bleek dat niet mogelijk. Op de afbeelding is dat te zien: de data van DIVV (blauw) zijn op de kaart van Amsterdam geprojecteerd:

Het valt op dat de linker en rechter rijstrook door DIVV uit elkaar getrokken zijn, wellicht om de rijstroken in verschillende richting visueel goed te kunnen onderscheiden. Praktisch betekent het dat het niet mogelijk is op te vragen wat de snelheid van het verkeer in noordelijke richting in de IJtunnel is - waardoor de toepasbaarheid van de data flink afneemt.

In de door Waag gebouwde API is dit opgelost. De API maakt de versnipperde datasets eenduidig, gestandaardiseerd en op een centrale manier beschikbaar. Ontwikkelaar Bert Spaan heeft een algoritme geschreven dat de snelheden van DIVV koppelt aan wegen en rijstroken. Nog een voordeel van de API is dat je alleen die data krijgt die je opvraagt. Er is geen druk dataverkeer nodig om eerst het hele doorstromingsbestand van Amsterdam te downloaden, je vraagt de snelheid van de wegen op die voor jouw route van belang zijn. In de CitySDK API is nog meer data aanwezig die op je route van belang kan zijn, bijvoorbeeld of het regent - je wil immers niet zozeer weten of het (ergens) in Amsterdam regent, maar of dat voor jouw route het geval is.

Steden en datasets

De CitySDK API vormt het startpunt voor het uitwisselbaar maken van datasets tussen Europese steden. Op dit moment zijn in de API data te vinden op het gebied van Openbaar Vervoer in Nederland, Finland (Helsinki, Tampere), Manchester en Istanbul. Daarnaast zijn beschikbaar weergegevens (buienradar), taxistandplaatsen in Amsterdam, culturele data uit Arts Holland en als referentielaag alle data van OpenStreetMap. Ook meldingen die burgers naar de deelnemende gemeenten sturen (over defecte verlichting, stoeptegels, de MOR) zijn toegankelijk.

De CitySDK API biedt dus extreem veel makkelijker toegang tot open data. Of dat goed en zinvol werkt is alleen te testen door de API te gebruiken. Daarom hebben we een aantal demo's gebouwd en wordt er gewerkt aan een pilot-app.

Het bouwen van de CitySDK API en de applicaties is een leerzaam proces. Door tegelijkertijd te werken aan de visualisatie is het systeem flink geoptimaliseerd om met grote hoeveelheden data om te gaan. Dwingende standaarden worden zoveel mogelijk vermeden. Daarnaast zijn er nog een aantal stappen te zetten op het gebied van integratie binnen het project.

Er zijn natuurlijk nog een hoop datasets die we willen toevoegen. Hopelijk komt binnenkort de live informatie beschikbaar over de Nederlandse snelwegen van Rijkswaterstaat (NDW). De data van de NS zijn nog altijd beperkt (waardoor Nederland fors minder mobiliteits apps heeft als Finland bijvoorbeeld, waar alles open is). Ook onze partnersteden in het project (Barcelona, Helsinki, Istanbul, Lamia, Manchester, Rome) zijn hard bezig met het toevoegen van data. Istanbul en Lamia hebben hun eigen endpoints (lokale API's) al live, Helsinki volgt binnenkort.

Belangrijk is nu dat de API gebruikt gaat worden, zodat de waarde van het beschikbaar stellen van data via een open API duidelijk wordt voor overheden en diensten. Zij worden dan getriggerd om kwaliteit van de data te verhogen en meer datasets ter beschikking te stellen.

Over de auteur

  • Job Spierings is Head of Programme van team Code bij Waag.