AI op je datawarehouse: de vraag is niet of het mag, maar hoe
Mag AI op je datawarehouse met gevoelige data? Jeroen laat zien dat de echte vraag niet 'of' is maar 'hoe', en hoe je het vastlegt in techniek in plaats van in goede bedoelingen.
Een datawarehouse zit vol gevoelige gegevens. Alles van je organisatie komt er samen: opnames, diagnoses, planningen, personeel en financiën. Dat maakt het ook een plek waar AI veel zou kunnen betekenen, want in die berg data valt van alles te vinden, te analyseren en te versnellen. Toch gebeurt dat zelden. Vaak komt het er niet van, omdat het gesprek erover stokt zodra iemand AVG noemt. De combinatie van AI en patiëntdata roept al snel de vraag op of dat eigenlijk wel mag, en zonder duidelijk antwoord blijft het liggen.
Twee vragen onder één reflex
Die reflex is begrijpelijk, want de zorgen erachter zijn echt. Maar als stopknop is hij te grof. “AVG” is zelden een kale nee, eerder een “het hangt ervan af”. Onder die reflex liggen namelijk twee verschillende vragen, die in zo’n gesprek door elkaar lopen. De eerste is of het eigenlijk mag, en of het veilig genoeg is om met deze gegevens te doen. De tweede ligt dieper: wil je afhankelijk zijn van een buitenlandse aanbieder, en kan een buitenlandse overheid bij je data?
De vergeten vraag weegt het zwaarst
Die tweede vraag wordt vaak vergeten, terwijl hij zwaar weegt. Veel mensen denken dat een zakelijk abonnement, waarbij je invoer niet wordt gebruikt om modellen te trainen, het probleem oplost. Dat haalt een belangrijke zorg weg, maar niet de zwaarste. Valt je aanbieder onder Amerikaans recht, dan kan die onder de Cloud Act verplicht worden gegevens af te geven aan de Amerikaanse overheid, ook als ze in een Europees datacentrum staan. Microsoft bevestigde dat in 2025 onder ede bij de Franse Senaat, en kort geleden bleek het concreet, toen het bedrijf namen van Nederlandse ambtenaren deelde met een commissie van het Amerikaanse Huis van Afgevaardigden. De locatie van de server doet er dan minder toe dan de vraag onder welk recht je aanbieder valt.
AI op je BI betekent twee verschillende dingen
Toch is dat geen reden om AI helemaal buiten je datawarehouse te houden. “AI inzetten op je BI” betekent eigenlijk twee heel verschillende dingen, met een heel verschillend risico. Het ene is AI die je BI helpt bouwen: een assistent die meedenkt over je ETL, je datamodel of je Power BI-ontwerp. Die werkt met structuur, logica en code, en komt niet aan de patiëntrecords zelf. Het risico voor je gevoelige data is daar laag, dus dat laat ik hier rusten. Het andere is AI waarmee je met je data praat: vragen stellen aan de inhoud, een tekst laten samenvatten, een tabel laten analyseren. Daar ontmoet gevoelige data het model, en daar zit de eigenlijke vraag.
Vastleggen in techniek, niet in goede bedoelingen
Hoe doe je dat tweede dan veilig? Daar draait het om, en het is concreter dan het klinkt. Je legt het vast in de techniek, en laat het niet afhangen van de goede bedoelingen van een gebruiker. Standaard draait het werk op een model in je eigen omgeving. Per taak staat in code of die naar een extern model mag. Een gevoelige samenvatting van vrije tekst zet je simpelweg niet open voor de cloud, zodat die lokaal blijft. En voor analyse-taken waarbij je wél met gestructureerde data naar buiten gaat, kun je gevoelige velden vooraf deterministisch pseudonimiseren met vaste regels, zodat een AI daar niet zelf over hoeft te oordelen. Elke aanroep wordt geregistreerd: welke taak, welk model, hoeveel gegevens.
“Dat mag niet” wordt “dat mag wel, mits”. En dat is een veel productiever vertrekpunt.
Wat je ermee wint
Wat je hiermee wint, is meer dan techniek. Je verandert het gesprek. Je kunt nu per geval bepalen wat verantwoord is, zonder de deur meteen helemaal dicht te gooien. De waarde die in je datawarehouse ligt, komt zo binnen bereik van AI, zonder dat je je gevoelige data uit handen geeft.
Wij hebben dat voor het praten-met-data op deze manier gebouwd, met de AI Gateway: lokaal als standaard, vrijgave per taak in code, en pseudonimisering waar dat nodig is. Elke aanroep wordt vastgelegd, zodat je achteraf kunt navertellen wat er is gebeurd.
De vraag is dus niet of AI bij je datawarehouse mag. De vraag is hoe je het zo inricht dat je het kunt verantwoorden. Wie dat goed regelt, kan de waarde van AI benutten en tegelijk de controle over zijn data houden.