In dit project streven we naar de ontwikkeling van een vernieuwende methode voor het opsporen van witwaspraktijken, gebaseerd op geavanceerde AI-technieken met hypergraafrepresentaties en process mining. Deze aanpak biedt een samenhangend beeld van de betrokken transacties, kan de complexiteit van de data aan en blijft tegelijk begrijpelijk voor experts, zodat zij hun analyses en beslissingen goed kunnen onderbouwen.
In dit project ontwikkelen we een innovatieve aanpak voor het bestrijden van witwaspraktijken, gebaseerd op geavanceerde AI-methoden met hypergraafrepresentaties en process mining. Deze combinatie biedt een integraal overzicht van de betrokken transacties, kan omgaan met de complexe aard van de data en blijft tegelijk begrijpelijk voor experts die de data analyseren, zodat zij hun beslissingen goed kunnen onderbouwen.
Betaalplatforms zoals Adyen zetten technologie in om fraude effectief op te sporen. Dat is geen eenvoudige opgave, omdat zowel legitiem als frauduleus klantgedrag voortdurend verandert, en ook per markt verschilt. Machine learning speelt hierin een sleutelrol, maar bestaande methoden zijn gevoelig voor het aanleren van misleidende verbanden. Dit project heeft als doel om machine learning-technieken te ontwikkelen die geïnspireerd zijn op causaliteit, om zo de robuustheid van fraudedetectie te verbeteren bij veranderingen in de data.
De impact van fouten in data op de output van AI-modellen is lastig te voorspellen en te meten, terwijl zulke fouten wel degelijk risico’s opleveren voor compliance met regelgeving. Dit project richt zich daarom op het ondersteunen van niet-technische gebruikers bij het valideren en verbeteren van de kwaliteit van hun data. Zij moeten datakwaliteitsregels kunnen formuleren in natuurlijke taal. We ontwikkelen een data-gedreven aanpak die zulke regels inzet om domeinexperts te helpen bij het verfijnen van datakwaliteitsregels en het uitvoeren van “stresstests” op AI-modellen verderop in de keten. Dit project is bij uitstek geschikt voor iemand met een sterke data engineering-achtergrond en interesse in samenwerking met domeinexperts.
De groeiende rol van hernieuwbare energiebronnen zorgt voor een fundamentele verschuiving in energiemarkten richting een duurzamer en groener systeem. Deze transitie brengt echter ook nieuwe typen risico’s met zich mee, zoals volume-, net- en klimaatgebaseerde risico’s. Dit project richt zich op het prijzen en hedgen van hernieuwbare energiecontracten die onder invloed staan van deze risicofactoren, met speciale aandacht voor computationele methodologieën. Door geavanceerde wiskundige modellen te combineren met data-gedreven technieken, beoogt het onderzoek robuuste strategieën te ontwikkelen voor het effectief beheersen van deze opkomende risico’s.
Bij het authenticeren en autoriseren van transacties moeten verschillende beslissingen worden genomen, die momenteel vaak worden ondersteund door afzonderlijke modellen in een pipeline. Een meer geïntegreerde aanpak kan leiden tot beter onderbouwde beslissingen, maar vraagt om complexe optimalisatie in een hoog-dimensionale ruimte. In dit project zetten we reinforcement learning in om dit optimalisatieprobleem aan te pakken. Daarbij richten we ons op uitdagingen zoals een hoog-dimensionale actieruimte, off-line leren en evaluatie, en het balanceren van meerdere doelstellingen.
Veel stappen in het goedkeuringsproces van transacties zijn gericht op het modelleren van causale factoren achter gebruikersgedrag — bijvoorbeeld welke vorm van authenticatie of autorisatie leidt tot minder frictie bij betalingen voor specifieke gebruikersgroepen. Het inschatten van zulke causale effecten gebeurt vaak via A/B-tests, die kostbaar zijn en slechts een beperkte groep gebruikers omvatten. De resultaten van deze tests worden zelden hergebruikt of gecombineerd met eerdere experimenten of observaties. Dit project richt zich op het hergebruiken van data uit eerdere A/B-tests en het ontwerpen van gerichtere, efficiëntere en goedkopere experimenten. Zo willen we causale inzichten in gebruikersgedrag op een betrouwbare en robuuste manier verwerven.
Het succes van transformers bij het verwerken van sequentiële data voor taal- en visuele taken (zoals ChatGPT, DALL-E) heeft geleid tot grote belangstelling voor het toepassen van deze modellen op voorspellingsvraagstukken. Hierdoor zijn er talloze onderzoeksvoorstellen ontstaan die veel aandacht trekken en tegelijkertijd discussie en scepsis oproepen over de werkelijke capaciteiten van deze van nature black-box modellen. Dit project wil deze zorgen aanpakken door een mechanistische interpreteerbaarheidsaanpak te hanteren—een benadering die waardevol is gebleken bij het begrijpen van taal- en visuele modellen. Op deze manier streven we ernaar om meer inzicht te bieden in de interne werking van time-series transformers.