Waarom menselijke controle op AI pas werkt als je de mens ook echt een taak geeft

strategie, AI en besluitvorming in de praktijk

Veel organisaties voelen inmiddels dezelfde spanning rond AI. Aan de ene kant is de belofte groot: sneller zoeken, beter samenvatten, patronen herkennen, werkprocessen ondersteunen. Aan de andere kant klinkt steeds vaker de geruststellende zin: “Er blijft altijd een mens naar kijken.”

Dat klinkt verstandig. En soms is het dat ook. Maar vaak is het vooral een geruststellend decorstuk.

Want de vraag is niet of er ergens in het proces nog een mens zit. De vraag is: wat moet die mens precies doen? Welke fout moet hij herkennen? Welke informatie krijgt zij daarvoor? Hoeveel tijd is er? Mag de medewerker afwijken van het AI-advies? Wordt dat gewaardeerd, of vooral als lastig gezien? En wie is verantwoordelijk wanneer de mens formeel mocht ingrijpen, maar praktisch geen enkele ruimte had om dat te doen?

Daar zit de hidden gem: human-in-the-loop is geen controlemaatregel, maar een ontwerpopgave.

Het misverstand: als een mens meekijkt, is het verantwoord

In veel AI-discussies wordt menselijke controle behandeld als een soort veiligheidsstempel. Volledig geautomatiseerd voelt riskant. Een mens erbij voelt verantwoord. Daarmee ontstaat een simpele tweedeling: óf de machine beslist, óf de mens beslist.

Maar in de praktijk is het zelden zo helder.

Een medewerker krijgt een AI-score te zien. Een model doet een voorstel. Een systeem markeert een casus als afwijkend. Een chatbot vat een dossier samen. Een algoritme sorteert meldingen, aanvragen of signalen. Formeel beslist de mens. Praktisch gezien duwt het systeem de aandacht, de volgorde, de interpretatie en soms zelfs de uitkomst al een bepaalde kant op.

Dat is precies waar automation bias relevant wordt: mensen kunnen de neiging hebben om geautomatiseerde voorstellen te volgen, juist omdat die professioneel, objectief of efficiënt lijken. Onderzoek naar automation bias in publieke besluitvorming waarschuwt dat menselijke controle niet automatisch een effectieve waarborg is tegen de risico’s van geautomatiseerde beslisvoorstellen.

Met andere woorden: een mens in het proces is nog geen betekenisvolle menselijke controle.

Het mechanisme: toezicht zonder taak wordt schijnveiligheid

Human oversight werkt alleen als de menselijke rol inhoudelijk is ontworpen. De EU AI Act formuleert human oversight bij high-risk AI als middel om risico’s voor gezondheid, veiligheid en grondrechten te voorkomen of te minimaliseren. De European Data Protection Supervisor gaat nog een stap verder en benadrukt dat effectieve menselijke betrokkenheid tastbare positieve impact moet hebben op uitkomsten: schade beperken, fairness bevorderen en de kwaliteit, betrouwbaarheid en accountability van beslissingen verbeteren.

Dat klinkt juridisch en beleidsmatig, maar de praktische consequentie is eenvoudig:

Een mens moet niet alleen aanwezig zijn. Een mens moet kunnen handelen.

Daarvoor zijn minimaal vijf ontwerpvragen nodig:

  1. Detectietaak: welke fout, afwijking of vertekening moet de mens kunnen herkennen?
  2. Informatiepositie: welke context heeft de mens nodig om het AI-voorstel te kunnen beoordelen?
  3. Tijd en aandacht: hoeveel ruimte is er om echt te toetsen in plaats van alleen te klikken?
  4. Bevoegdheid: mag de mens corrigeren, pauzeren, escaleren of het systeem negeren?
  5. Cultuur: wordt afwijking van het systeem gezien als professioneel oordeel of als verstoring?

Zonder die vijf vragen is human-in-the-loop vaak theater. De organisatie kan zeggen dat de mens beslist, maar het proces is zo ingericht dat de mens vooral bevestigt.

De vuistregel: ontwerp de controletaak vóór je de AI-taak ontwerpt

Een simpele vuistregel:

Als je niet kunt uitleggen welke AI-fout de mens moet kunnen ontdekken, heb je nog geen human oversight ontworpen.

Gebruik daarbij maximaal vijf regels:

  • Laat AI nooit alleen een antwoord geven; laat het ook onzekerheid, aannames of alternatieven tonen.
  • Geef de mens een expliciete controlevraag, niet alleen een akkoordknop.
  • Ontwerp escalatie vóór ingebruikname, niet na incidenten.
  • Meet niet alleen snelheid, maar ook correcties en afwijkingen.
  • Beloon professioneel tegenspreken van het systeem.

Dit sluit aan bij het bredere denken: AI-risicomanagement vraagt om systematische aandacht voor context, impact en onverwachte effecten, niet alleen om technische performance.

Toepassing 1: operationeel — de medewerker als klikmachine

Stel: een medewerker beoordeelt meldingen die door AI zijn geprioriteerd. Het systeem markeert sommige meldingen als urgent. De medewerker ziet de score, een korte toelichting en een knop: akkoord of niet akkoord.

Formeel is dit human-in-the-loop. Maar inhoudelijk is het zwak.

Want wat moet de medewerker toetsen? Of de score logisch voelt? Of de onderliggende gegevens kloppen? Of bepaalde groepen structureel vaker hoog scoren? Of de melding misschien urgent lijkt door recente media-aandacht? Dat zijn verschillende controletaken.

Een betere inrichting zou zijn:

  • toon welke factoren het zwaarst hebben meegewogen;
  • vraag de medewerker expliciet: “Welke alternatieve verklaring is mogelijk?”;
  • maak afwijking van het AI-advies normaal en zichtbaar;
  • verzamel correcties als feedback voor procesverbetering;
  • geef duidelijke stop- en escalatieregels.

Dan wordt de mens niet gebruikt als rubber stamp, maar als professionele tweede laag.

Toepassing 2: tactisch — de teamleider als bewaker van afhankelijkheid

Op tactisch niveau ontstaat een ander risico: teams gaan AI gebruiken omdat het werkt, snel voelt en werkdruk verlaagt. Dat is begrijpelijk. Maar precies daardoor kan afhankelijkheid sluipend groeien.

De teamleider moet dan niet alleen vragen: “Gebruiken we AI goed?”
De betere vraag is: “Waar zijn we gestopt met zelf kijken?”

Signalen van ongezonde afhankelijkheid zijn bijvoorbeeld:

  • medewerkers nemen AI-samenvattingen over zonder broncontrole;
  • afwijkingen van AI-adviezen worden zeldzaam;
  • casussen die het systeem niet goed begrijpt, verdwijnen uit beeld;
  • het team kan niet meer uitleggen waarom een bepaalde uitkomst logisch is;
  • snelheid wordt belangrijker dan toetsbaarheid.

De tactische taak is dus niet alleen sturen op adoptie, maar ook op professionele frictie. AI mag werk versnellen, maar mag het oordeel niet verdoven.

Toepassing 3: strategisch — het MT als eigenaar van de beslisarchitectuur

Voor MT’s zit de grootste valkuil in abstracte governance. Er komt een AI-beleid, een ethisch kader, een risicomatrix en misschien een werkgroep. Allemaal nuttig. Maar de echte vraag is concreter:

Op welke beslismomenten mag AI invloed hebben, en hoe blijft menselijke verantwoordelijkheid daar betekenisvol?

Dat vraagt om beslisarchitectuur. Niet alleen: welke tool gebruiken we? Maar:

  • welke besluiten worden door AI voorbereid of beïnvloed;
  • welke risico’s zijn acceptabel en welke niet;
  • welke beslissingen vereisen menselijke herbeoordeling;
  • welke signalen dwingen tot pauzeren;
  • wie mag tegen het systeem ingaan;
  • hoe leren we van correcties, incidenten en twijfelgevallen?

Dit past goed bij de manier waarop MindAssist AI benadert: niet als los hulpmiddel, maar verbonden aan informatie, werkprocessen, professionele afwegingen en keuzes die organisaties daadwerkelijk moeten maken.

Wat je níet moet doen

Maak human oversight niet tot een vinkje in een projectplan. Zet niet simpelweg “medewerker controleert output” in een procesbeschrijving zonder te ontwerpen wat controleren betekent. En gebruik menselijke betrokkenheid niet als excuus om systeemrisico’s, datakwaliteit of onduidelijke verantwoordelijkheden te parkeren.

Ook belangrijk: verwacht niet dat medewerkers vanzelf kritisch blijven wanneer het proces hen vooral beloont voor snelheid, productie en doorstroom. Dan vraag je professioneel oordeel, maar ontwerp je gehoorzaamheid.

Afsluiting: de mens moet geen decor zijn

AI vraagt niet alleen om betere modellen, betere data of betere regels. Het vraagt om betere werkprocessen rond oordeel, twijfel en verantwoordelijkheid.

De vraag is dus niet: “Hebben we een human-in-the-loop?”
De vraag is: “Heeft die human een echte loop?”

Kan de mens zien wat ertoe doet? Begrijpen wat onzeker is? Afwijken zonder gedoe? Escaleren zonder gezichtsverlies? Leren van correcties? En verantwoordelijkheid dragen omdat er ook daadwerkelijk handelingsruimte is?

Pas dan wordt menselijke controle meer dan theater.

Wie met AI aan de slag wil, doet er goed aan niet te beginnen bij de tool, maar bij de beslismomenten waar AI invloed krijgt. Juist daar wordt zichtbaar wat zinvol, verantwoord en werkbaar is. Voor organisaties die dat scherp willen krijgen, is een compacte verkenning vaak een verstandige eerste stap. Neem daarvoor contact op met MindAssist.