L'Agente Invisibile

Costruiamo agenti autonomi senza osservarli. L'AI agentica è dove era l'infrastruttura server prima di DevOps: opaca per default.

L'Agente Invisibile

C'era un tempo, non molto lontano, in cui i server erano scatole nere. Andavano giù alle tre di notte e la persona di turno fissava un terminale vuoto, senza log, senza dashboard, senza alcuna idea di cosa fosse cambiato nelle ultime sei ore. Il deploy era stato fatto a mano, forse. Uno script era stato eseguito, forse. Nessuno aveva documentato nulla. Il server batteva ancora, ma da fuori non si vedeva niente. Era vivo, ma illeggibile.

Ci raccontavamo che fosse normale. I sistemi erano complicati, non si poteva strumentare tutto. E poi funzionavano, il più delle volte. Quando cadevano, si riparavano. L'opacità era il prezzo della complessità. Questa storia l'abbiamo già vissuta — e l'abbiamo superata.

DevOps non è stato solo un cambiamento di strumenti: è stato un cambiamento epistemologico. Ha detto: il sistema non è una scatola nera. Si può vedere. Si deve vedere. Infrastructure as code, deploy immutabili, logging centralizzato: non erano feature, erano una dichiarazione. La visibilità non è un optional. È una proprietà strutturale del sistema.

Oggi stiamo costruendo un nuovo tipo di sistema. E stiamo facendo lo stesso errore. Solo che stavolta la scatola nera pensa.

L'architettura dell'opacità

Gli agenti AI autonomi stanno entrando nei nostri flussi di lavoro, nei nostri tool di sviluppo, nelle nostre pipeline. Prendono decisioni. Scrivono codice. Modificano configurazioni. E noi non abbiamo quasi nessun modo di vedere cosa stanno facendo mentre lo fanno.

Non è un problema di qualità del risultato. Un agente può produrre codice perfettamente funzionante ed essere comunque un problema. Il punto è che non sappiamo come ci è arrivato. Quali alternative ha scartato. Quali assunzioni implicite ha fatto. In un sistema deterministico, queste domande hanno risposte verificabili. In un sistema probabilistico che sceglie tra miliardi di percorsi possibili, la traccia del ragionamento è l'unica cosa che separa la fiducia dalla fede.

Qui emerge il problema strutturale. Più un agente è capace, più il suo funzionamento interno diventa invisibile. L'impressione di «magia», quella sensazione che proviamo quando risolve un problema complesso in pochi secondi, è direttamente proporzionale alla nostra incapacità di ricostruire il processo. Non è un effetto collaterale. È una proprietà emergente dell'architettura.

Il problema non è che ci mancano gli strumenti di osservabilità. Il problema è che stiamo progettando agenti come se l'osservabilità fosse un'aggiunta successiva — un layer da applicare quando qualcosa va storto. Ma l'osservabilità non funziona così. O è integrata nell'architettura fin dal primo giorno, o non esiste. Puoi aggiungere un dashboard a un sistema opaco; non lo renderai mai trasparente.

DevOps non ha risolto il problema dei server aggiungendo monitoring a infrastrutture artigianali. L'ha risolto rendendo l'infrastruttura stessa codice — qualcosa di leggibile, versionabile, tracciabile. Il salto non è stato tecnico. È stato concettuale.

Per gli agenti, il salto equivalente deve ancora arrivare.

La metrica che manca

C'è una convergenza in corso. Da un lato, i team che usano agenti di coding lamentano esattamente questo: non il codice sbagliato, ma l'impossibilità di capire il percorso. La frustrazione non è sul cosa, ma sul come. Dall'altro lato, le feature più celebrate nei tool agentici sono proprio quelle che migliorano il loop di feedback umano-agente: review a livello di linea, commenti sui diff, canvas visivi che mostrano il flusso di lavoro. Non è una coincidenza. È il mercato che segnala un bisogno che l'architettura non ha ancora soddisfatto.

Eppure, se guardiamo ai benchmark, la nostra ossessione collettiva, non troverete una metrica di osservabilità. Misuriamo la qualità del codice generato, la percentuale di task completati, il tempo di esecuzione. Non misuriamo quanto sia comprensibile il processo. Quanto sia ispezionabile una decisione. Quanto sia riproducibile un ragionamento.

Questo non è un dettaglio. È un vuoto strutturale. Nel software tradizionale abbiamo imparato, a caro prezzo, che ciò che non si misura non si migliora. E ciò che non si migliora, alla scala sbagliata, diventa debito tecnico.

Solo che nel mondo degli agenti, il debito tecnico non è codice legacy. È fiducia evaporata. Ogni agente che opera senza traccia, ogni decisione non ispezionabile, ogni ragionamento non riproducibile accumula passività che nessun refactoring potrà mai ripagare.

E poi c'è la sicurezza. Visibilità e sicurezza sono due facce della stessa moneta. Se non vedi cosa fa un agente, non puoi proteggere il sistema. Non puoi proteggere i dati. Non puoi fare audit. Non puoi dimostrare conformità.

L'agente che opera in background, senza supervisione, senza traccia, senza log decisionale, è un vettore di rischio che non abbiamo ancora preso sul serio. Non perché non ci importi. Ma perché siamo ancora nella fase in cui la magia ci distrae dal pericolo.

Non stiamo dimenticando di aggiungere osservabilità. La stiamo progettando fuori dall'architettura. E lo stiamo facendo perché un agente pienamente visibile sembra meno intelligente di uno opaco.
Affidiamo compiti sempre più complessi ad agenti che non possiamo osservare, in un loop che si auto-alimenta: più l'agente è autonomo, meno lo vediamo; meno lo vediamo, più rinunciamo a capirlo; più rinunciamo a capirlo, più deleghiamo alla cieca.

Eppure qualcosa si sta muovendo. Ci sono segnali, ancora deboli e sperimentali, di un contro-movimento. Agenti che espongono il loro ragionamento in canvas visivi. Sistemi che permettono di branchare e versionare le traiettorie decisionali. Interfacce che trasformano il flusso di pensiero dell'agente in qualcosa di navigabile, quasi come un diff. Non sono ancora la norma. Ma indicano una direzione.

La direzione è questa: l'agente del futuro non sarà giudicato solo per cosa produce, ma per quanto è ispezionabile il processo che lo produce. La trasparenza diventerà un requisito funzionale, non un accessorio. Esattamente come il logging e il monitoring lo sono diventati per qualsiasi sistema in produzione.

Il parallelismo con il pre-DevOps non è un'analogia elegante. È una mappa. Ci dice che i colli di bottiglia non sono quasi mai dove li cerchiamo. Oggi siamo ossessionati dalla capacità dei modelli: più parametri, contesti più lunghi, ragionamenti più profondi. Ma il vero collo di bottiglia dell'AI agentica non sarà la potenza del modello. Sarà l'invisibilità del processo. Non è un problema che si risolve con un modello migliore. Si risolve con un'architettura diversa.

Si parla molto di quanto siano intelligenti i modelli. Ma siamo in grado di guardarli mentre pensano? Perché se non possiamo vederli, non possiamo fidarci. E se non possiamo fidarci, non possiamo delegare. E senza delega, l'agente non è un agente. È solo un'altra scatola nera in un'infrastruttura che pensavamo di aver già imparato a rendere trasparente.

Approfondimenti

Continua l'esplorazione

Una selezione di percorsi, profilo professionale e possibilità di confronto collegati ai temi trattati nel sito.

Contattami Profilo
Adriano Amalfi
Autore

Adriano Amalfi

Digital Transformation & Innovation in Financial Services