Vrijwel iedereen kent de kadastrale kaarten waarop percelen staan weergegeven. Maar weinigen weten dat die slechts  een schets van de werkelijkheid zijn. Dat wil niet zeggen het Kadaster niet precies weet waar grenzen liggen. Die zijn honderdvijftig jaar lang opgemeten en handmatig vastgelegd op zo’n vijf miljoen veldwerken. De mathware van Sioux zorgt voor een doorbraak bij het digitaliseren van die enorme hoeveelheid complexe geodata.

‘Alleen al vanuit de perceptie van het publiek is het creëren van een kloppende kadastrale kaart van Nederland wenselijk.’ Dat stelt Rik Ebbeling, manager product- en procesinnovatie bij het Kadaster. ‘Daarnaast vergroot het onze efficiency. Het uitzoeken van een specifiek veldwerk en uitmeten in het veld vergt nu gemiddeld acht uur. Wanneer een één-op-één-kaart kaart beschikbaar is, kan dat veel sneller, door automatische interpretatie en omdat direct bruikbare gps-coördinaten beschikbaar zijn. Het handmatig vectoriseren van onze veldwerken zou echter een kapitaal kosten. Daarom vroegen wij in een Request For Information of automatisering een oplossing kon bieden. Er reageerden elf bedrijven die ieder een deeloplossing aandroegen. Dat gaf hoop. We dachten dat het niet kon, nu zien we kansen.'

Machine learning

Een van de bedrijven die reageerde op de vraag van het Kadaster was Sioux. Jeroen Franken, Senior Mathware Engineer bij Sioux: ‘Als hightechbedrijf beschikt Sioux over een enorme know-how over beeldherkenning en big data. Onze wiskundigen zagen direct mogelijkheden. Hun wetenschappelijke bagage is enorm, maar ze weten ook wanneer het nodig is om complexe zaken gewoon in de praktijk uit te proberen. Het Kadaster pakte dat advies op en gaf de opdracht om binnen vier maanden met een Proof of Concept te komen. Dat kon alleen door het in stukken knippen van het probleem; zo kun je focussen en blijf je niet in complexiteit hangen. We werkten enkele weken hard aan een thema. Vervolgens pakten we het volgende op. Zo moesten de jpeg-artefacten in gescande kaarten worden verwijderd. Die oplossing lag al op de plank. Er was ook een algoritme nodig dat diverse soorten lijnen kan herkennen. Daarnaast moeten horizontale en gekantelde cijfers worden herkend en gelezen. Dat kan met behulp van machine learning. Een andere wezenlijke opgave was het begrijpen van de relatie tussen al die lijnen en cijfers, weten welke belangrijk zijn, hoe ze zich tot elkaar verhouden en of de in- en output logischerwijs klopt.'

‘Voor ons werkte die agile aanpak van Sioux bijzonder prettig, omdat we konden bijdragen aan een goed resultaat’, vult Ebbeling aan. ‘De technische kennis hebben we niet, maar we weten wel wat waardevolle data is, hoe die moet worden geïnterpreteerd en waar wij behoefte aan hebben. Zo halen we het maximale uit elkaar. Sioux doorgrondt onze problematiek dan inmiddels ook als de beste.’

Human algorithm

Na het afronden van de haalbaarheidsstudie concludeerde Sioux – onder voorbehoud van een hoop mitsen en maren – dat het mogelijk moet zijn om één kaart in 18 minuten te digitaliseren. Het leeuwendeel van die tijd gaat zitten in het handwerk dat noodzakelijk blijft. Inmiddels is het project een nieuwe fase ingegaan. Een multidisciplinair team met medewerkers van verschillende organisaties, waarvan acht van Sioux, werkt bij het Kadaster aan het optimaliseren van de methodiek, mathware en software.

Ebbeling: ‘Het digitaliseren van de veld-werken lukt nooit zonder de inzet van mensen die de grijze vlekken in moeten kleuren. Sommige kaarten zijn te onduidelijk, incompleet en bevatten fouten. Daarnaast is de standaard methodiek van het intekenen van lijnen en opschrijven van cijfers niet altijd gehanteerd. En zo zijn er nog wel wat oorzaken te noemen. Maar die 18 minuten is in ieder geval beter dan de negentig waarmee we begonnen. Bij die potentiële tijdwinst hielp de suggestie van Sioux om het menselijke correctiewerk te organiseren per element en niet per kaart. Die methodiek doopten ze ‘human algorithm’. Het doel is nu nog verder te komen wat betreft snelheid en duidelijkheid over wat echt haalbaar is. Tegelijkertijd moet een oplossing worden gevonden voor het automatisch aan elkaar koppelen van gedigitaliseerde kaarten. In april 2019 neemt het Kadaster een beslissing. Wanneer onze mensen kaarten gebruiken, worden die sowieso gedigitaliseerd. Afhankelijk van de uiteindelijke kosten zal dit ook voor deelgebieden of heel Nederland gebeuren.'

Model.Name