Vai al contenuto
AI Agents

Gli agenti si guadagnano l'autonomia come le nuove assunzioni

Il modo più rapido per perdere fiducia in un agente IA è dargli piena autonomia fin dal primo giorno. Il modo più rapido per non distribuirne mai nessuno è aspettare che sia perfetto. Abbiamo fatto girare agenti su…

Aman Tiwari
Aman Tiwari
Ingegnere del software
PubblicatoQ2 2026
Lettura9 min

Il modo più rapido per perdere fiducia in un agente IA è dargli piena autonomia fin dal primo giorno. Il modo più rapido per non distribuirne mai nessuno è aspettare che sia perfetto. Abbiamo fatto girare agenti su oltre 100.000 chiamate clienti reali, e il modello che funziona davvero è il più antico del management: un agente non si distribuisce, si inserisce.

Una nuova assunzione non riceve le chiavi della cassaforte il primo mattino. Osserva. Tratta i casi semplici sotto supervisione. Si guadagna il proprio perimetro mostrandosi affidabile prima su un perimetro più ristretto. Gli agenti funzionano esattamente allo stesso modo — e trattarli così fa tutta la differenza tra un sistema che il vostro team operativo difende e uno che disattiva di nascosto.

01Fatelo partire in prova

Ogni agente che consegnamo inizia in una modalità in cui può proporre ma non agire. Su una linea vocale, ciò significa che può condurre la conversazione, comprendere l'intento e preparare l'azione — fissare l'appuntamento, emettere il rimborso, aggiornare la scheda — ma un essere umano approva l'azione prima che venga eseguita. L'esperienza del cliente è interamente automatizzata; la conseguenza, invece, resta sotto controllo.

Sembra una mezza misura per chi voleva «un'IA che se la cava da sola». Non lo è. Il periodo di prova è il luogo in cui scoprite i venti casi limite che il vostro prompt non aveva mai immaginato, con una rete di sicurezza sotto ciascuno di essi. Non rallentate l'agente — comprate le prove che vi permetteranno in seguito di accelerarlo in tutta sicurezza.

La scorciatoia costosa

Saltare il periodo di prova per «andare veloci» è la decisione più costosa che i team prendono con gli agenti. I fallimenti che avreste intercettato fin dalla prima settimana sotto forma di semplici suggerimenti innocui diventano allora azioni eseguite — rimborsi emessi, appuntamenti prenotati in doppio, un cliente a cui è stato detto qualcosa di falso — e ora dovete ricostruire la fiducia con l'azienda, non solo correggere un bug.

02La trascrizione è il prodotto

Si crede che il modello sia l'asset. Per un agente in esercizio, l'asset è il repository delle trascrizioni — ogni turno di parola, ogni chiamata a uno strumento, ogni decisione, ogni correzione umana, catturati e interrogabili. Sono al tempo stesso i vostri dati di addestramento, il vostro debugger, la vostra pista di audit e il vostro strumento di costruzione della fiducia.

Quando qualcosa va storto nella chiamata 40.312, «l'IA ha sbagliato» non serve a nulla. «In quel turno, l'agente ha interpretato male la data perché il chiamante ha detto "martedì prossimo" di lunedì, e il nostro risolutore di date ha presunto la settimana in corso» è una correzione. Ottenete la seconda frase solo se avete registrato l'intera catena di ragionamento, e non solo l'output finale.

call_event · structured turn log
{
  call_id:   "c_40312",
  turn:      14,
  intent:    "reschedule_appointment",
  heard:     "can we do next tuesday",
  resolved:  { date: "2026-06-16", confidence: 0.71 },  // bassa → messa sotto controllo
  proposed:  "move booking to Tue 16 Jun, 10:00",
  action:    "held_for_approval",                // non eseguita
  human:     { decision: "edited", to: "2026-06-23" }  // impara da questo
}

Quella data a bassa confidenza è tutto ciò che conta. L'agente non ha finto di essere sicuro. Si è segnalato da solo, l'azione è stata trattenuta, un essere umano l'ha corretta, e quella correzione diventa un esempio etichettato per l'iterazione successiva. La trascrizione ha trasformato un quasi-incidente in un miglioramento.

Un agente senza trascrizione non è un dipendente. È uno sconosciuto che prende decisioni che non potete esaminare.

— Sull'osservabilità come fiducia

03La barriera di approvazione che non rimuovete mai

Ecco la regola su cui non transigeremo: ogni azione difficile da annullare mantiene un essere umano nel ciclo, in modo permanente. Non finché l'agente non è «abbastanza buono» — in modo permanente. Spostare denaro, eliminare dati, assumere un impegno legale, tutto ciò che un cliente non può facilmente disfare: resta sotto controllo, indipendentemente da quante chiamate l'agente abbia condotto brillantemente.

La barriera non è il segno di un sistema immaturo. È una scelta di progettazione relativa alla conseguenza. Le azioni reversibili — rispondere a una domanda, redigere un messaggio, fare una ricerca — accedono rapidamente alla piena autonomia. Le azioni irreversibili non vi accedono, perché il costo di un errore è asimmetrico e nessun numero di precisione rende accettabile «aver emesso un rimborso sull'account sbagliato».

100k+Chiamate reali gestite

Su vere linee vocali a contatto con i clienti.

3Livelli di autonomia

Osservazione, azione sotto controllo, piena autonomia — guadagnati, non concessi.

100%Azioni irreversibili registrate

Ogni azione eseguita è attribuibile ed esaminabile.

04Promuovete sulle prove, non sulle impressioni

Un agente passa dal periodo di prova all'autonomia su una classe di azione precisa quando le prove dimostrano che se l'è meritata — non quando qualcuno ha una buona sensazione sulla demo. Definiamo i criteri di promozione a monte, per intento:

  • Volume. Ha gestito abbastanza casi di questo tipo da rendere significativo il campione — non tre chiamate fortunate.
  • Tasso di accordo. Gli esseri umani hanno approvato la sua azione proposta senza modifiche oltre una soglia che fissiamo con la propensione al rischio del cliente.
  • Profilo di errore. Quando ha sbagliato, ha sbagliato in sicurezza — ha segnalato una bassa confidenza anziché eseguire un errore con sicurezza.

Soddisfate tutte e tre le condizioni per un dato intento e quell'intento viene promosso: la barriera cade per le azioni reversibili, le soglie di confidenza si allentano. Mancatele e resta in prova, con le trascrizioni che vi mostrano esattamente quali casi correggere. La promozione è una decisione basata sui dati, con una traccia scritta — ed è anche ciò che permette a un cliente prudente di dire sì.

05Progettate la chiamata sbagliata prima di quella giusta

La demo è l'agente che gestisce un chiamante chiaro e collaborativo. La produzione è un chiamante con una connessione scadente, che parla sopra l'agente, che pone tre domande alla volta, con un accento per cui il modello vocale non è stato calibrato. Il vostro sistema si definisce da ciò che fa in quella chiamata, non nella demo.

Progettiamo quindi prima il percorso del fallimento. L'agente deve sempre saper fare tre cose: riconoscere che sta superando le proprie competenze, trasferire in modo pulito a un essere umano con tutto il contesto, e non lasciare mai il chiamante bloccato in un loop. Un ben gestito «mi lasci passarle un collega che potrà aiutarla» è un esito riuscito. Una risposta sbagliata data con sicurezza è l'unico vero fallimento.

La metrica che conta

Non ottimizziamo per «chiamate interamente automatizzate». Ottimizziamo per «chiamate ben risolte» — il che include quelle che l'agente ha correttamente trasferito a una persona. Un agente che conosce i propri limiti e indirizza di conseguenza supera un agente troppo sicuro di sé su tutte le misure che contano realmente per un cliente.

06Il manuale di inserimento

Se mettete un agente di fronte a clienti reali, ecco l'ordine in cui procederemmo:

  1. Registrate tutto fin dalla prima chiamata. Trascrizioni strutturate a livello del turno di parola prima di mettere a punto il minimo prompt. Non potete migliorare ciò che non avete catturato.
  2. Rilasciate in modalità osservazione o sotto controllo. Traffico reale, intenti reali, zero autonomia irreversibile. Lasciate che la realtà scriva la vostra lista di casi limite.
  3. Fissate per iscritto criteri di promozione per intento. Volume, tasso di accordo, profilo di errore. Allineateli alla propensione al rischio del cliente, non al vostro entusiasmo.
  4. Mantenete la barriera per l'irreversibile per sempre. Denaro, eliminazione, impegni — l'essere umano nel ciclo è una scelta di progettazione permanente, non una fase.
  5. Trattate il trasferimento come un successo. Misurate la risoluzione, non il tasso di automazione. Premiate l'agente che sa quando ritirarsi.

Condotta così, l'autonomia smette di essere un atto di fede per diventare un registro. Ogni perimetro che l'agente detiene, se l'è guadagnato, con le trascrizioni a dimostrarlo. È la versione di «un'IA che se la cava da sola» che potete davvero avallare a vostro nome — perché l'avete inserito come inserireste chiunque vi proponiate di affidare ai vostri clienti.

Aman Tiwari
Scritto da

Aman Tiwari

Ingegnere del software

Aman progetta agenti IA in produzione — voce, chat e automazione di back-office che devono restare affidabili davanti a clienti reali. Si occupa dei guardrail, delle trascrizioni e dei sistemi human-in-the-loop che permettono all'automazione di guadagnarsi la propria autonomia.

Hai un progetto in mente?

Raccontacelo — ti risponderemo entro un giorno lavorativo con una valutazione onesta su fit e scope.