22 september
CWI helpt VN met AI gevoelige data uit crisisplatform te filteren
Het Humanitarian Data Exchange (HDX) platform van de Verenigde Naties bevat meer dan 19.000 datasets uit 254 crisisgebieden wereldwijd. Lokale overheden delen er data over conflicten, natuurrampen en humanitaire noodsituaties. Deze informatie is cruciaal voor de coördinatie van hulpverlening, maar kan gevaarlijk zijn wanneer gevoelige gegevens in verkeerde handen terechtkomen.
CWI-onderzoeker Madelon Hulsebos en AI-masterstudent Liang Telkamp ontwikkelden daarom een nieuwe methode om gevoelige data te detecteren en te filteren. Hun onderzoek introduceert het concept ‘contextueel gevoelige data’. Hierbij gaat het niet alleen om persoonsgegevens, maar ook om informatie die afhankelijk van tijd, plaats en situatie schade kan veroorzaken. Zo zijn de coördinaten van een ziekenhuis in Nederland niet direct gevoelig, maar die van een ziekenhuis in een oorlogsgebied wel.
Eerder maakte de VN gebruik van Google DLP, maar deze tool bleek veel minder nauwkeurig en genereerde veel vals-positieven. De nieuwe AI-aanpak gebruikt VN-richtlijnen en Large Language Models (zoals GPT-4 en Qwen) om datasets automatisch te beoordelen. Dit leverde duidelijke verbeteringen op: waar Google DLP slechts 63 procent van de gevoelige persoonsgegevens detecteerde, haalde de nieuwe methode tot 94 procent. Bovendien halveerde het aantal vals-positieven, wat de werklast van Quality Assurance Officers aanzienlijk verlaagt.
Het onderzoek toont ook het belang van uitlegbaarheid. De AI-modellen konden niet alleen gevoelige data herkennen, maar ook toelichten waarom bepaalde informatie werd bestempeld als gevoelig. Dit vergroot de betrouwbaarheid en bruikbaarheid van de resultaten.
De Verenigde Naties hebben inmiddels besloten de nieuwe mechanismen in het HDX-platform te integreren. In oktober presenteert Hulsebos de resultaten tijdens een VN-bijeenkomst in Barcelona. De toepassingen reiken verder dan de VN alleen: ook publieke cloudplatforms en open data-portalen kunnen profiteren. Daarmee biedt de methode een waardevolle stap richting veiliger gebruik van data in tijden waarin datasets ook als trainingsmateriaal voor AI-modellen dienen.
Lees het volledige artikel op de website van CWI.
Vergelijkbaar >
Vergelijkbare nieuwsitems

23 september
De Albanese AI-minister Diella: tussen innovatie, symboliek en risico’s
Lees meer >

22 september
CWI helpt VN met AI gevoelige data uit crisisplatform te filteren
Lees meer >

18 september
€3,8 miljoen voor AI-onderzoek naar toegankelijkheid in Nederlandse steden
Lees meer >