Il prodotto non è il modello

I modelli sono commodity. Eppure nessuno si fida del codice AI senza rileggerlo.

Il prodotto non è il modello

Il paradosso

Un modello open-weight che gira su hardware consumer (laptop, non cluster) oggi batte su molti task pratici i modelli frontier di sei mesi fa. Il gap tra ciò che esegui in locale e ciò che esce dai data center si sta assottigliando a una velocità che dovrebbe far tremare chi ha scommesso miliardi sull'addestramento proprietario. Per il novanta per cento dei casi d'uso reali, i modelli sono già abbastanza buoni: sono commodity.

I modelli sono cento volte più capaci di due anni fa. La fiducia è rimasta esattamente dov'era. Questo è un paradosso.

Eppure c'è un numero che non si muove: zero. Zero sviluppatori disposti a mandare in produzione codice AI senza rileggerlo, riga per riga. Zero aziende che lasciano un agente autonomo su infrastrutture critiche senza un essere umano nel loop.

La capacità aumenta vertiginosamente. L'affidabilità percepita, no.

La spiegazione "i modelli allucinano ancora" è vera ma fuorviante. Le allucinazioni non sono il problema, sono il sintomo. Il vero problema è che stiamo cercando la risposta nell'oggetto sbagliato.

Il collo di bottiglia

Prendi un modello buono e mettilo in produzione senza infrastruttura intorno: hai un motore da Formula Uno montato su un telaio di cartone. Non bisogna chiedersi quanti cavalli hai ma se sterza, frena e non si disintegra alla prima curva.

Quello che manca non è più intelligenza. È tutto il resto.

  • Memoria persistente: che non degrada dopo tre turni di conversazione in un gioco del telefono senza fili. I knowledge graph stanno sostituendo il RAG vettoriale, non per velocità ma perché rappresentano la conoscenza in una struttura che un agente può navigare, interrogare, aggiornare.
  • Orchestrazione: che non collassa quando la complessità supera la finestra di contesto. Il pattern planner/executor è emerso dalla pratica, non da un paper. È ciò che rende un sistema AI debuggabile invece che una scatola nera.
  • Sicurezza: un agente che esegue codice, chiama API, modifica file non è uno strumento passivo. È un attore. Va governato con sandbox, autorizzazioni granulari, audit trail. Non con un prompt che gli chiede gentilmente di comportarsi bene.
  • Osservabilità in tempo real: se puoi solo guardare i log a posteriori quando qualcosa è già andato storto, non puoi fidartene. È fisicamente impossibile.

La storia che si ripete

Tutto questo manca ma l'abbiamo già vista. Stiamo rivivendo gli anni pre-DevOps dell'industria del software.

Prima di Docker, prima di Kubernetes, ogni azienda scriveva i propri script di deploy. Ogni team reinventava la gestione della configurazione. L'infrastruttura era un costo sommerso pagato individualmente da tutti.

Succede la stessa cosa con l'infrastruttura degli agenti.

Ogni team si costruisce il proprio layer di memoria. Ogni startup reinventa l'orchestrazione. I meccanismi di sicurezza per agenti vengono riscritti da zero in ogni codebase.

È una duplicazione colossale di sforzo, ed è il vero problema dell'AI agentica.

I segnali iniziano a vedersi

Protocolli standard per la comunicazione tra agenti e strumenti stanno emergendo come standard de facto. La cybersecurity è il primo dominio verticale dove la fiducia non è una feature ma il prodotto stesso. I knowledge graph stanno sostituendo il RAG vettoriale non per moda ma perché risolvono un problema che i vettori non possono affrontare. Il pattern planner/executor nasce da implementazioni indipendenti, segno che non è solo una buona idea ma una necessità architetturale.

Ma sono solo segnali, non una strategia.

E finché ogni azienda costruisce la propria infrastruttura per agenti come fosse il 2012 e stesse scrivendo il proprio script di deploy in bash, il breakeven non arriverà.

E non arriverà da un modello migliore. Non da più parametri, più dati, più compute. Non da un benchmark che sale di due punti su una metrica di cui nessuno si fida più..

Arriverà quando l'infrastruttura che rende affidabile l'intelligenza commoditizzata sarà così integrata e invisibile, così ovvia, che nessuno penserà più di costruirsela da solo. Come oggi nessuno si scrive il proprio runtime.

Non stiamo aspettando un modello migliore. Stiamo aspettando l'architettura che renda il modello irrilevante.

Il prodotto non è mai stato il modello. È sempre stato il sistema che trasforma la capacità grezza in qualcosa di cui fidarsi. E quel sistema, oggi, lo stiamo ancora costruendo tutti a mano, un pezzo alla volta, in centinaia di aziende diverse che non si parlano.

Vincerà chi trasformerà l'infrastruttura in prodotto.

Non chi costruisce il motore più potente.

Approfondimenti

Continua l'esplorazione

Una selezione di percorsi, profilo professionale e possibilità di confronto collegati ai temi trattati nel sito.

Contattami Profilo
Adriano Amalfi
Autore

Adriano Amalfi

Digital Transformation & Innovation in Financial Services