Facebook Pixel REEKS IMPACT (slot): "We willen slapende data tot leven wekken" - Hogeschool Gent
Foto REEKS IMPACT (slot): "We willen slapende data tot leven wekken"

“We willen slapende data tot leven wekken.”

W

“We willen slapende data tot leven wekken.”

REEKS IMPACT: Willem De Keyzer
Centre for Applied Data Science

De prins wekte Doornroosje tot leven na een honderdjarige slaap, De Keyzer doet dat met (recente) data. Willem De Keyzer is onderzoekscoördinator van het Centre for Applied Data Science (CADS). Dat onderzoekscentrum verschilt in uitgangspunt en doelstelling van de andere elf HOGENT-onderzoekscentra: het focust minder op eigen onderzoeksprojecten en richt zich vooral op het ondersteunen van andere onderzoekscentra op het vlak van data-analyse. In die zin geldt het als het sluitstuk van de HOGENT-onderzoeksstrategie, al is ‘ontsluitstuk’ in deze context misschien een betere term.

Willem vat het zelf zo samen: “De doelstelling van CADS is de datageletterdheid te verhogen bij onderzoekers, lectoren, studenten en externen. Door specifiek advies te verlenen, maar ook via vormingssessies en begeleiding. Zo willen we de onderzoekscentra naar een hoger niveau tillen.”

Het Centre for Applied Data Science concentreert zich op dataverwerking. Maar wat betekent dat concreet? Doen niet alle onderzoekscentra dat?

Willem: “Een goede omgang met wetenschappelijke data is natuurlijk een essentieel onderdeel van elk onderzoeksproces. Het spreekt voor zich dat de methodologie van gegevensverzameling afgestemd moeten zijn op de onderzoeksvragen. Maar dat klinkt eenvoudiger dan het is. Er zijn doorgaans verschillende methoden voorhanden die tegenover elkaar afgewogen moeten worden en elke hun sterktes en zwaktes hebben in termen van haalbaarheid en validiteit. Zo moeten onder meer kosten en baten afgewogen worden om tijd en middelen efficiënt in te zetten en overbodige datacollectie te voorkomen. Vaak moeten er ook nog technisch-operationele keuzes gemaakt worden vooraleer kan worden overgegaan tot dataverzameling.

We zitten bovendien op een kantelpunt in dataverzameling en -verwerking. De digitaliseringstrend zorgt ervoor dat onze maatschappij steeds meer steunt op datagedreven applicaties en toepassingen van artificiële intelligentie. Dat leidt tot een toename van data, zowel in complexiteit als in volume. Om die toevloed aan gegevens adequaat te verzamelen en er betekenisvolle inzichten uit te halen, is vaak specifieke knowhow nodig. Een centrum dat op dat vlak ondersteuning biedt, leek ons een interessante meerwaarde.”

Dus dataverzameling en -analyse wordt complexer?

Willem: “Inderdaad. De huidige digitalisering en ‘Internet of Things’ brengt nieuwe mogelijkheden, maar ook uitdagingen met zich mee. Ik denk bijvoorbeeld aan dynamische data, zoals die via sensoren van stappentellers worden verzameld. Die technologieën, die verbonden zijn met apps en smartphones, kunnen zeer veel relevante data bevatten. Maar hoe ga je daarmee om? Hoe sla je die gegevens op en hoe analyseer je ze? Als je daar geen specifieke kennis en expertise over hebt, dan is het zeer moeilijk om dergelijke evoluties en technologische mogelijkheden nauwgezet te blijven opvolgen, naast je eigen vakgebied.

Het Centre for Applied Data Science brengt dan ook onderzoekers samen die wel over dergelijke – en andere - expertise beschikken en ervaring hebben met statistische dataverwerking. Zij vormen een aanspreekpunt voor de onderzoekers uit andere onderzoekscentra.

Het is immers niet omdat je een kei bent in je vakgebied en inhoudelijk sterke onderzoeksstrategieën kan uitbouwen, dat je ook sterk bent in statistiek.

CADS kan inzake statistische kennis een meerwaarde bieden door advies te verlenen over welke techniek het best geschikt is om de onderzoeksvraag te beantwoorden en door te ondersteunen bij het interpreteren van de resultaten. Daarnaast kan CADS ook ingezet worden bij het analyseren van complexe datasets zoals extreem grote databestanden, gelinkte of real-time datasets en onderzoekscentra, maar ook lesgevers, studenten en externen helpen om adequaat in te spelen op nieuwe tendensen en mogelijkheden van dataverwerking.”

Waarom is ervoor gekozen om die expertise rond data-analyse te concentreren in een aparte entiteit en niet te integreren in de bestaande onderzoekscentra?

Willem: “We hebben er zeer bewust voor gekozen om de expertise rond data-analyse te centraliseren in één entiteit en de deskundigen ter zake niet te verspreiden over de onderzoekscentra. Want daardoor maken we elkaar sterker.

Je mag immers niet vergeten dat de specialiteit van CADS weliswaar dataverzameling en -analyse is, maar dat is nog altijd een zeer breed spectrum. Het is verre van evident om expert te zijn op zowel het vlak van ruimtelijke dataverwerking als van big data, AI, statistiek en kwalitatieve analyse, om maar enkele disciplines te noemen. Door die verschillende aspecten van data-analyse te groeperen, creëren we complementariteit en kunnen we van elkaar leren.

Een apart centrum rond data-analyse heeft ook meer uitstraling dan wanneer je dezelfde expertise over verschillende onderzoekscentra verspreidt. Het draagt bij tot je geloofwaardigheid.

In eerste instantie richten we ons naar de onderzoekscentra en de departementen, maar na verloop van tijd willen we ook externe organisaties adviseren.

Ook bij bedrijven is er immers veel nood aan dataverwerking. Grote internationale ondernemingen hebben doorgaans wel zelf data-analisten in hun rangen, maar België is een kmo-land, en die kmo’s beschikken meestal niet over de knowhow en het budget om aan data-analyse te doen. Nochtans hebben zij vaak veel en waardevolle gegevens waar je relevante info kan uit distilleren.”

Hoe moet dat concreet werken? Wachten jullie tot iemand spontaan komt aankloppen?

Willem: “Vanuit CADS voorzien we in een dataverbindingspersoon per onderzoekscentrum. Die volgt waar het onderzoekscentrum mee bezig is en detecteert in een vroeg stadium de noden op het vlak van dataverwerking.

Er zijn daarnaast binnen HOGENT verschillende opleidingsonderdelen over wetenschappelijk redeneren en handelen en vaak moeten studenten ook een wetenschappelijk luik uitwerken in een bachelorproef onder begeleiding van een promotor. Ook hier zal CADS op verzoek adviseren en meedenken.

Maar we kunnen op het vlak van beleidsopvolging eveneens een meerwaarde betekenen. Neem open data science: meer en meer worden wetenschappelijke onderzoeksgegevens vrij beschikbaar. De Europese Unie pleit er steeds nadrukkelijker voor om onderzoeksdata zo veel mogelijk te ontsluiten voor de maatschappij. Een terechte vraag, want onderzoeksprojecten werken grotendeels met belastinggeld dus is het logisch dat de output van die research terugkeert naar de samenleving. Ook in het Vlaamse regeerakkoord wordt expliciet verwezen naar de verantwoordelijkheid van kennisinstellingen om een beleid te voeren dat wetenschappelijk onderzoek zo snel mogelijk publiek toegankelijk maakt, zowel publicaties als de achterliggende onderzoeksdata.

Maar hier komt de privacywetgeving over de schouder meekijken: welke data kan je in die context verzamelen en openstellen? Daar moet je als onderzoekscentrum niet alleen een duidelijk zicht op hebben, je moet het ook kunnen verantwoorden. Ook voor dergelijke vraagstukken willen wij de onderzoekscentra met raad en daad bijstaan.”

CADS profileert zich op de eerste plaats als adviserend en ondersteunend, maar betekent dit dat jullie geen eigen onderzoeksprojecten uitvoeren?

Willem: “We worden niet gefinancierd om eigen onderzoek te doen en dat is niet onze eerste bestaansreden, maar toch plannen we onderzoek rond AI, en dat op twee vlakken: AI for Education en AI for Operations. We beschikken op HOGENT immers over zeer veel data. Die worden nu al geanalyseerd, onder meer om de evolutie van de inschrijvingen in de verschillende opleidingen te monitoren, maar er zijn nog meer opportuniteiten. Zo kunnen we het bijvoorbeeld mogelijk maken op basis van data-analyse dat studenten hun eigen examenresultaten benchmarken tegenover medestudenten, tegenover een langjarig gemiddelde, enz. Ook voor docenten zien we hier nog veel opties.

In het Operations-luik concentreren we ons op voorspellende algoritmes in IT-infrastructuur. Die moeten in staat zijn om situaties te detecteren die tot problemen kunnen leiden, zodat de IT-specialisten vroegtijdig kunnen ingrijpen.”

Kan je eens met een concreet voorbeeld tastbaar maken hoe CADS een meerwaarde kan creëren voor andere onderzoekscentra?

Willem: “Een voorbeeld: we kregen de vraag of er een manier bestaat om voor een bepaald gebied te bekijken welke voorzieningen er zijn. Bij CADS kunnen wij dan de relevante publieke gegevens die beschikbaar zijn (maar op aparte platformen) combineren tot één kaart waar alle info gegroepeerd staat.

Een ander concreet project: in het kader van de omgevingsvergunning voor campus Schoonmeersen gaan we na hoe we het aantal bezoekers op de campus betrouwbaar kunnen tellen met beeldherkenning van bewakingscamera's en andere technologieën. Maar die real-time gegevens over campusbezetting kunnen gebruikt worden om drukte te voorspellen in restaurants, bibliotheek of parking of om bij een noodevacuatie het aantal personen in een gebouw te kennen (zie kaderstuk).

Dikwijls resulteert een onderzoeksproject overigens in veel meer gegevens dan deze die men effectief inzet, bijvoorbeeld omdat sommige data op dat ogenblik, in de specifieke onderzoekscontext, minder relevant zijn. Vaak ontbreekt het aan tijd en middelen om die achteraf toch te analyseren en bijvoorbeeld aan te grijpen voor een vervolgonderzoek. Ook op dat vlak kunnen we een faciliterende rol spelen.”

Wat zal je tot een tevreden coördinator maken, eens we enkele jaren verder zijn?

Willem: “Eerst en vooral: als binnen HOGENT bekend is welke expertise we in huis hebben en als we de onderzoekscentra hebben kunnen ‘ontzorgen’. Dat ze met andere woorden gemakkelijk de weg naar ons vinden als het over het analyseren van data gaat.

Velen beseffen nu nog onvoldoende hoe waardevol de gegevens zijn waarover ze beschikken. Het zou mooi zijn mochten we vanuit het Centre for Applied Data Science op dat vlak de mindset een stuk kunnen bijsturen en de grote hoeveelheid aan slapende data tot leven te wekken.

Belangrijk is ook dat we bij nieuwe onderzoeksprojecten in de startfase mee aan tafel kunnen schuiven. Want via zo’n ‘early involvement’ kunnen we de methodologie mee bepalen.

Ik hoop ook dat we via externe dienstverlening een meerwaarde kunnen betekenen bij vooral kmo’s, al zal dat een werk van iets langere adem zijn. Dit zal ons in staat stellen om minder afhankelijk te zijn van interne financiering en het geldt daarnaast als een belangrijke graadmeter van ons succes: de mate waarin externe organisaties de weg vinden naar ons om hen te ondersteunen. Want dat toont aan dat ze ons erkennen als een kwalitatieve partner die een duidelijke een meerwaarde biedt.”

Willem De Keyzer

“Het is niet omdat je een kei bent in je onderzoeksgebied, dat je ook sterk bent in statistiek. Een centrum dat op dat vlak ondersteuning biedt, is een interessante meerwaarde.”
Willem De Keyzer
(onderzoeks­coördinator CADS)

Campus in beweging

Bewakingscamera's

In het kader van de omgevingsvergunning voor campus Schoonmeersen wil de dienst Patrimonium een zicht krijgen op het aantal bezoekers en vroeg daarom aan het Centre for Applied Sciences (CADS) of en hoe dat op een betrouwbare manier kan worden geteld.


De eenvoudigste manier is gebruik maken van wifigegevens, schetst Willem De Keyzer: “Door het aantal registraties aan zogenaamde ‘access points’ te meten, kan je een zicht te krijgen op de mobiliteit van personen op de campus. Maar accuraat is dat niet: eenzelfde smartphone of tablet wordt immers geregistreerd telkens als je aan een ander (of hetzelfde) access point passeert. Dat zijn dus geen unieke gegevens. Daarom zijn we op zoek gegaan naar andere mogelijkheden.”


En zo kwam CADS terecht bij de bewakingscamera's: via bepaalde algoritmes kunnen op basis van de camerabeelden in- en uitgaande bewegingen gemonitord worden zonder dat daar personeel moet voor worden ingezet. Willem De Keyzer: “Nieuw is dat op zich niet: voor grote events worden al vaker bedrijven ingezet die deze en andere technologieën aanbieden om mensenstromen op te volgen. Maar bij HOGENT hebben we de vereiste apparatuur zelf voorhanden. We moeten het potentieel ervan op het vlak van dataverzameling en –analyse alleen beter benutten.”


Druktebarometer

Die real-time gegevens over campusbezetting kunnen onder meer gehanteerd om een druktebarometer te creëren: ze laten toe om het aantal personen te voorspellen in restaurants, bibliotheek, op de parking of bij een noodevacuatie in een gebouw. Zo zou je bijvoorbeeld studenten duidelijk kunnen maken dat Resto D te druk is, maar dat in het restaurant van gebouw B wel nog plaatsen beschikbaar zijn.

Het gaat niet alleen over in- en uitbewegingen in een gebouw of specifieke plaats, maar ook over mensenstromen tussen verschillende plaatsen binnen een grote campus zoals die van Schoonmeersen.


“Die gegevens bieden overigens niet alleen voordelen voor HOGENT maar ook voor het gemeenschappelijk belang. Als je de data over de bewegingen naar en op de campus opslaat, kan je na verloop van tijd voorspellingen doen over wanneer er zich bijvoorbeeld pieken voordoen op de parking en over het risico op verkeershinder daardoor van en naar de R4”, schetst Willem De Keyzer.


“Je zou ook kunnen nagaan in welke mate de weersomstandigheden een rol spelen bij de keuze om met de fiets, trein of auto naar de campus te komen – en zo te anticiperen op mogelijke bottlenecks. Dat laat je uiteindelijk toe om, op basis van zeer concrete en gedetailleerde gegevens,  in te grijpen op de organisatie van de campus, zodat hinder voor studenten en personeel, maar ook voor de buurtbewoners, zo veel mogelijk beperkt wordt.”

Vond je deze pagina al de max? Check dan zeker ook deze eens.

Centre for Applied Data Science
We add value to your data! Het Centre for Applied Data Science creëert meerwaarde uit data door deze te verzamelen, te organiseren, te analyseren en toegankelijk te …
REEKS IMPACT "De duurzaamheidstrein komt stilaan op snelheid"

Zeggen dat FTILab+ een vlaggenschip is van HOGENT, is geen overdrijving. Al jarenlang is het onderzoekscentrum een kruispunt waar onderzoekers, sectororganisaties, ontwerpers en studenten elkaar …

REEKS IMPACT: "Een broeinest worden waar kruisbestuiving de regel is"

“Je kan moeilijk onderzoek doen in het sociale domein zonder een standpunt in te nemen, zonder te vertrekken van een bepaald waardenkader”, zegt Jessica De Maeyer, coördinator van …

REEKS IMPACT "Zorg en welzijn gaan in essentie over interactie tussen mensen"

Zoals je van een onderzoekscentrum dat zich 360° Zorg en Welzijn laat noemen, kan verwachten, bestrijkt het onderzoeksveld een waaier aan zorgaspecten. Maar het gaat evenzeer over de de …

REEKS IMPACT: "De meerwaarde van design zit in de combinatie van verbeelding en ratio."

Eveline Seghers ging in november 2020 bij HOGENT aan de slag als coördinator van het Futures through Design. De functie en de onderzoeksthema’s van het centrum trokken haar sterk …

REEKS IMPACT: "De uitdaging: compacter wonen zonder leefbaarheid aan te tasten"

Met praktijkgericht onderzoek rond hot topics als mobiliteit, kwalitatief en betaalbaar wonen en de betonstop, zit het onderzoekscentrum Duurzaam Ruimtegebruik en Mobiliteit mee in de cockpit om in …

REEKS IMPACT: "Impact start al bij de keuze van je onderzoek"

In de vierde aflevering van de reeks IMPACT zoomen we in op het onderzoekscentrum AgroFoodNature. Onderzoekscoördinator Lieve Vermeiren is al jaren zeer vertrouwd met de domeinen waar het …

REEKS IMPACT "Een one-size-fits-all didactiek bestaat niet"

Een onderzoekscentrum dat focust op de toegang tot kwaliteitsvol onderwijs en levenslang leren voor iedereen, lijkt in de context van een hogeschool bijna onvermijdelijk. Toch heeft het Research …

Publicatiedatum: 11/05/2021