De snelste manier om het vertrouwen in een AI-agent te verliezen, is hem op dag één volledige autonomie geven. De snelste manier om er nooit een uit te rollen, is wachten tot hij perfect is. We hebben agents laten draaien op meer dan 100.000 echte klantgesprekken, en het model dat werkelijk werkt, is het oudste uit het management: je rolt een agent niet uit, je werkt hem in.
Een nieuwe medewerker krijgt op zijn eerste ochtend niet de sleutels van de kluis. Hij kijkt mee. Hij behandelt de eenvoudige gevallen onder toezicht. Hij verdient zijn werkterrein door zich eerst betrouwbaar te tonen op een nauwer terrein. Bij agents werkt het precies hetzelfde — en ze zo behandelen maakt het hele verschil tussen een systeem dat je operationele team verdedigt en een systeem dat het stilletjes uitschakelt.
01Laat hem op proef starten
Elke agent die we opleveren, begint in een modus waarin hij kan voorstellen maar niet handelen. Op een spraaklijn betekent dat dat hij het gesprek kan voeren, de intentie kan begrijpen en de actie kan voorbereiden — de afspraak boeken, de terugbetaling uitvoeren, de fiche bijwerken — maar een mens keurt de actie goed voordat ze wordt bevestigd. De klantervaring is volledig geautomatiseerd; het gevolg blijft onder controle.
Dit voelt als een halve maatregel voor wie « een AI die zichzelf redt » wilde. Dat is het niet. De proefperiode is de plek waar je de twintig grensgevallen ontdekt die je prompt nooit had voorzien, met een vangnet onder elk ervan. Je vertraagt de agent niet — je koopt het bewijs dat je hem later veilig zal laten versnellen.
De proefperiode overslaan om « snel te gaan » is de duurste beslissing die teams met agents nemen. De fouten die je in de eerste week als onschuldige suggesties zou hebben opgemerkt, worden dan bevestigde acties — uitgevoerde terugbetalingen, dubbel geboekte afspraken, een klant die iets verkeerds is verteld — en nu moet je het vertrouwen met het bedrijf heropbouwen, niet alleen een bug corrigeren.
02Het transcript is het product
Men denkt dat het model het kapitaal is. Voor een operationele agent is het kapitaal de transcriptopslag — elke gespreksbeurt, elke tool-aanroep, elke beslissing, elke menselijke correctie, vastgelegd en doorzoekbaar. Het is tegelijk je trainingsdata, je debugger, je audittrail en je instrument om vertrouwen op te bouwen.
Wanneer er iets misgaat bij gesprek 40.312, dient « de AI heeft het verknald » nergens toe. « Bij die beurt heeft de agent de datum verkeerd geïnterpreteerd omdat de beller ‘volgende dinsdag’ zei op een maandag, en onze datum-resolver de huidige week aannam » is een oplossing. Je krijgt de tweede zin alleen als je de hele redeneerketen hebt gelogd, en niet alleen de uiteindelijke uitvoer.
{
call_id: "c_40312",
turn: 14,
intent: "reschedule_appointment",
heard: "can we do next tuesday",
resolved: { date: "2026-06-16", confidence: 0.71 }, // laag → onder controle gehouden
proposed: "move booking to Tue 16 Jun, 10:00",
action: "held_for_approval", // niet bevestigd
human: { decision: "edited", to: "2026-06-23" } // leert hiervan
}
Die datum met lage betrouwbaarheid is waar het allemaal om draait. De agent deed niet alsof hij zeker was. Hij signaleerde zichzelf, de actie werd vastgehouden, een mens corrigeerde haar, en die correctie wordt een gelabeld voorbeeld voor de volgende iteratie. Het transcript veranderde een bijna-incident in een verbetering.
Een agent zonder transcript is geen medewerker. Het is een onbekende die beslissingen neemt die je niet kunt onderzoeken.
— Over observeerbaarheid als vertrouwen03De goedkeuringspoort die je nooit weghaalt
Hier is de regel waarop we niet zullen toegeven: elke actie die moeilijk terug te draaien is, houdt permanent een mens in de lus. Niet tot de agent « goed genoeg » is — permanent. Geld verplaatsen, gegevens verwijderen, een juridische verbintenis aangaan, alles wat een klant niet eenvoudig ongedaan kan maken: dat blijft onder controle, hoeveel gesprekken de agent ook briljant heeft gevoerd.
De poort is geen teken van een onvolwassen systeem. Het is een ontwerpkeuze met betrekking tot het gevolg. Omkeerbare acties — een vraag beantwoorden, een bericht opstellen, iets opzoeken — bereiken snel volledige autonomie. Onomkeerbare acties bereiken die niet, omdat de kost van een fout asymmetrisch is en geen enkel nauwkeurigheidscijfer « een terugbetaling op de verkeerde rekening uitgevoerd » aanvaardbaar maakt.
Op echte, klantgerichte spraaklijnen.
Observeren, actie onder controle, volledige autonomie — verdiend, niet verleend.
Elke bevestigde actie is toewijsbaar en onderzoekbaar.
04Promoveer op basis van bewijs, niet van indrukken
Een agent gaat van de proefperiode naar autonomie voor een specifieke klasse van acties wanneer het bewijs aantoont dat hij die heeft verdiend — niet wanneer iemand een goed gevoel heeft bij de demo. We bepalen de promotiecriteria vooraf, per intentie:
- Volume. Hij heeft genoeg gevallen van dit type behandeld om de steekproef betekenisvol te maken — geen drie gelukkige gesprekken.
- Akkoordpercentage. Mensen hebben zijn voorgestelde actie zonder wijziging goedgekeurd boven een drempel die we vaststellen samen met de risicobereidheid van de klant.
- Faalprofiel. Wanneer hij zich vergiste, vergiste hij zich veilig — hij signaleerde lage betrouwbaarheid in plaats van een fout zelfverzekerd te bevestigen.
Voldoe aan deze drie voorwaarden voor een gegeven intentie en die intentie wordt gepromoveerd: de poort valt weg voor de omkeerbare acties, de betrouwbaarheidsdrempels verslappen. Mis ze en hij blijft op proef, terwijl de transcripten je precies tonen welke gevallen je moet corrigeren. Promotie is een datagedreven beslissing, met een schriftelijk spoor — en dat is ook wat een voorzichtige klant ja laat zeggen.
05Ontwerp het slechte gesprek vóór het goede
De demo is de agent die een heldere, coöperatieve beller afhandelt. De productie is een beller op een slechte verbinding, die door de agent heen praat, drie vragen tegelijk stelt, met een accent waarvoor het spraakmodel niet is gekalibreerd. Je systeem wordt bepaald door wat het doet in dat gesprek, niet in de demo.
We ontwerpen daarom eerst het faalpad. De agent moet altijd drie dingen kunnen: erkennen dat hij zijn competenties te boven gaat, netjes overdragen aan een mens met de volledige context, en de beller nooit vastgelopen laten in een lus. Een goed gebracht « laat me een collega erbij halen die u kan helpen » is een geslaagd resultaat. Een zelfverzekerd gegeven fout antwoord is het enige echte falen.
We optimaliseren niet voor « volledig geautomatiseerde gesprekken ». We optimaliseren voor « goed opgeloste gesprekken » — wat ook die omvat welke de agent correct heeft overgedragen aan een persoon. Een agent die zijn grenzen kent en dienovereenkomstig doorverwijst, overtreft een te zelfverzekerde agent op elke maatstaf die er voor een klant werkelijk toe doet.
06Het inwerkdraaiboek
Als je een agent voor echte klanten plaatst, is dit de volgorde waarin wij te werk zouden gaan:
- Log alles vanaf het eerste gesprek. Gestructureerde transcripten op het niveau van de gespreksbeurt voordat je ook maar één prompt bijstelt. Je kunt niet verbeteren wat je niet hebt vastgelegd.
- Lever op in observatie- of onder-controle-modus. Echt verkeer, echte intenties, nul onomkeerbare autonomie. Laat de realiteit je lijst van grensgevallen schrijven.
- Leg schriftelijk promotiecriteria per intentie vast. Volume, akkoordpercentage, faalprofiel. Stem ze af op de risicobereidheid van de klant, niet op je enthousiasme.
- Behoud de onomkeerbare poort voor altijd. Geld, verwijdering, verbintenissen — de mens in de lus is een permanente ontwerpkeuze, geen fase.
- Behandel de overdracht als een succes. Meet de oplossing, niet het automatiseringspercentage. Beloon de agent die weet wanneer hij zich moet terugtrekken.
Op deze manier aangepakt houdt autonomie op een sprong in het diepe te zijn en wordt het een grootboek. Elk werkterrein dat de agent in handen heeft, heeft hij verdiend, met transcripten om het te bewijzen. Dat is de versie van « een AI die zichzelf redt » waarvoor je werkelijk je naam kunt geven — omdat je hem hebt ingewerkt zoals je iedereen zou inwerken die je aan je klanten wilde toevertrouwen.

