Een nieuw fundament – met data-science en HP Z8-workstations

Door Redactie Daily Data Bytes | 03-03-2022

Wat gebeurt er als huizen verzakken en er structureel onderhoud nodig is? En wat moet je doen om problemen in de toekomst te vermijden? De gemeente Zaanstad en woningcoöperatie Parteon pakten het letterlijk fundamenteel aan. Data-sciencebureau Intellerts ontwikkelde met behulp van algoritmen een model voor opsporing en voorspelling van verzakkingen. Ze wisten zich gesteund door de uitgebreide technische mogelijkheden van de HP Z8-workstations die rekenkracht en snelheid bijeenbrachten om een model te ontwikkelen dat Zaanse huizen weer een toekomst geeft.

Zaanstad, dat zich uitstrekt van Zaandam tot aan Krommenie was ooit – in de middeleeuwen – een moerasgebied aan het IJ. Later kwamen de inpolderingen en groeide de bedrijvigheid. In de 19de en 20ste eeuw was de Zaanstreek een centrum van industriële bloei, met een groeiende bevolking. Wat in al die jaren niet veranderde was de bodem, een aaneenschakeling van klei en veen.

Fundamenten, en dus woningen en andere gebouwen, zakken in Zaanstad weg, en dat gaat om een aanzienlijk deel van de 70.000 panden in de streek. Ze zijn gebouwd op korte houten palen in een zachte ondergrond. Het hout is kwetsbaar voor bacteriële aantasting. De vrees was dat uiteindelijk eenderde van de totale woningvoorraad problemen zou krijgen. Onderzoek kost geld, en de inspectie gebeurde tot voor kort handmatig met metingen en inspectie.

‘Een systeem dat grote hoeveelheden gegevens aankan, robuust en flexibel’

Voorspellend model

Z by HPZou dat ook anders kunnen was de vraag die de gemeente Zaanstad en woningcoöperatie Parteon zich stelden. En daarmee was de eerste stap gezet naar een geavanceerde methode van werken. Want zou je op basis van data-analyse kunnen voorspellen welke panden en gebieden rijp zijn voor verbetering van de fundering, oftewel: ‘is op grond van het bouwjaar, de locatie, de stand van het grondwater, de algehele staat van het onderhoud en de zakkingssnelheid een voorspellend model op te stellen voor de kwaliteit van de funderingen van woningen en andere panden?’

De data-scientists van Intellerts gingen met de vraag aan de slag, geholpen door een enorme dataverzameling, afkomstig van onder andere het KNMI en het Kadaster. Ook werden meetdata van satellieten gebruikt om verzakking in voorbije jaren in kaart te brengen. Al die gegevens resulteerden in een zee aan data, wel 140 gigabyte, met bijna 140 miljoen records. Mooi, maar die gegevens moesten ook aan elkaar gekoppeld en getoetst worden om zo een voorspellend model te bouwen.

Hoge testnauwkeurigheid

De basis werd gevormd door machine learning. Met algoritmes, die continu leren van data, kun je ontwikkelingen, patronen en inzichten blootleggen die je niet achterhaalt met handmatige analysemethoden. Om het model te laten werken, moest een beoordelingssysteem worden ontworpen voor panden die inspectie, monitoring of een daadwerkelijke ingreep nodig hadden. Ontwikkelen van zo’n classificatie is een tijdrovende en ingewikkelde zaak.

Gelukkig maken recente ontwikkelingen in machinelearning gericht classificeren mogelijk. Dat deed Intellerts met AutoML. Dat pakket kon een inventarisatie maken van alle soorten informatie, een voorbewerking uitvoeren, een selectie toepassen en die continu verbeteren. Na een eerste zoekopdracht kwam Intellerts uit bij de TPOT-bibliotheek, die zelfgenerende programmering toepast om duizenden parametercombinaties te doorzoeken. Bovendien is het programma aan te passen via configuraties.

Na de classificatie op data, ontstond een optimale set, die resulteerde in een testnauwkeurigheid van 92,19%.

Door te vertrouwen op de rekenkracht van het HP Z8-workstation duurde het selecteren van de juiste classificaties net iets meer dan twee uur. Om een goede vergelijking te maken voerde het team dezelfde workload ook uit op een data-scientist-workstation (Intel Core i7 (8 cores), 16 GB of RAM, NVIDIA GTX1060 GPU with 6 GB VRAM,8 cores). Het verwerken van de workload duurde op dit workstation ruim acht uur. De HP Z8 was dus een factor vier sneller en wist zo kostbare tijd te winnen.

Snelle workstations

Waar huizen rusten op funderingen, rust het model en alle achterliggende gegevens op een ingenieus technisch fundament. Een systeem dat grote hoeveelheden gegevens aankan, robuust is en flexibel genoeg om op volle kracht de ontwikkelingen bij te houden.
Intellerts vond die technische basis in de HP Z8-workstations. Met recht een partner voor data-science. Daarop konden de verschillende stappen in het verwerken van gegevens en het bouwen van het model op een betrouwbare en snelle basis worden gerealiseerd. Het grote voordeel van de HP Z8 met NVIDIA graphicstechniek is ook dat je er veeleisende workloads en software-applicaties op kunt draaien, zodat je real-time data-science en AI kunt uitvoeren.

‘HP Z8-workstations - met recht een partner om op te bouwen’

Pure rekenkracht

Waar het natuurlijk vooral om draait is pure rekenkracht. De programmatuur moet ongelooflijk veel gegevens verwerken en daaruit werkbare modellen destilleren. Juist omdat de materie zo complex is en het aantal bronnen zo divers en complex, is een workstation noodzakelijk dat op een gedegen en snelle manier het overzicht biedt en kostenefficiënt werkt. Zo is de investering al in zeven maanden terugverdiend en is ze, in vergelijking met een volledig cloudgebaseerde oplossing, vier keer lager.

In feite vraag je van de apparatuur en software dat je vooruit kunt kijken met een schat aan gegevens die je anders niet zo snel en zo uitgebreid had kunnen vinden en afwegen. Daarmee leg je niet alleen een fundament onder beschikbare informatie maar ook onder alle activiteiten die je op grond van die gegevens moet gaan ondernemen. Dat geldt niet alleen voor Zaanstad. Of het nou om consumenten- of marketingonderzoek gaat, overal waar grote en gelaagde databronnen, van welke soort ook, bij elkaar gebracht moeten worden om te berekenen welke acties er nodig zijn, daar is pure rekenkracht essentieel.

Zekerheid

Uiteindelijk is met het model voor alle panden in de Zaanstreek berekend in welke risicogroep ze vallen. Zo’n 11.000 woningen lopen risico, en dat is circa 20 procent van het totaal. Maar door de situatie zo in kaart te brengen, bespaar je flink op telkens opduikende onderzoekskosten, en bovenal geef je bewoners zekerheid, net zoals aan de gemeentelijke overheid en aan beheers- en onderhoudsdiensten. En draag je bij aan maatschappelijk en economisch welvaren.

HP is kennispartner van Daily Data Bytes. Word ook kennispartner en bereik onze lezers via web, socials en nieuwsbrief met jouw content. Neem contact op met Tjitske Buurman voor meer informatie.

Auteur: Redactie Daily Data Bytes, Hoofdredacteur Jan Roekens.

Deze artikelen vind je vast ook interessant

Ook de laatste bytes ontvangen?