Indice

Introduzione

Chiunque abbia lavorato seriamente con agenti AI su processi aziendali ha incontrato prima o poi lo stesso problema: l'agente non migliora. Può essere configurato con cura, ottimizzato con settimane di lavoro, e produrre risultati eccellenti. Ma se incontra un errore oggi, lo incontrerà di nuovo domani nella stessa forma, perché non ha modo di consolidare quello che ha imparato in una sessione e portarlo nella successiva.

Il 6 maggio 2026, Anthropic ha pubblicato in research preview una funzione per Claude Managed Agents che affronta questo problema direttamente. Si chiama dreaming, e introduce la possibilità per un agente di rivedere le proprie sessioni passate, estrarne pattern, e aggiornare la propria memoria in modo autonomo tra una sessione e l'altra. È la prima funzionalità dell'ecosistema Claude che punta esplicitamente all'auto-ottimizzazione degli agenti, e i risultati dai primi adopter suggeriscono che il cambiamento è concreto, non solo concettuale.

Il limite strutturale degli agenti AI attuali

Un agente AI tradizionale ha una memoria di sessione: vede tutto quello che è successo nella conversazione corrente, può ragionare su di esso, può prendere decisioni basate su questo contesto. Ma quando la sessione finisce, quel contesto scompare. La sessione successiva riparte con le istruzioni originali, senza alcuna traccia di quello che è andato bene, di quello che è andato male, o dei pattern che sono emersi nel tempo.

Questo è un problema di design fondamentale. Gli strumenti software tradizionali non hanno questo problema perché vengono aggiornati esplicitamente: qualcuno analizza i log, identifica i bug, scrive una nuova versione. Ma gli agenti AI si assumono di fare cose che i software tradizionali non sanno fare, cioè gestire complessità e ambiguità. Eppure per migliorare su queste dimensioni, richiedono comunque intervento umano: qualcuno che legge i transcript, identifica i pattern di errore, e aggiorna i prompt o le istruzioni dell'agente.

Il risultato è che mantenere un agente AI su un workflow aziendale reale richiede un ciclo di manutenzione manuale continuo. Non è un problema insormontabile, ma è un costo che aumenta con la complessità del workflow e con il volume delle sessioni. Per le aziende che usano agenti su processi ad alto volume, questo costo diventa significativo.

Cos'è il dreaming e come funziona

Dreaming è un processo schedulato che viene eseguito tra una sessione e l'altra, non durante le sessioni attive. Riceve in input due elementi: il memory store corrente dell'agente (le informazioni che l'agente ha accumulato fino a quel momento) e i transcript delle sessioni passate. Produce in output un memory store aggiornato: una versione riorganizzata della memoria in cui i duplicati sono stati eliminati, le informazioni obsolete o contraddette sono state sostituite con quelle più recenti, e i nuovi pattern estratti dai transcript sono stati integrati.

Il processo identifica tre categorie di pattern che non sono visibili guardando una singola sessione. La prima sono gli errori ricorrenti: comportamenti che l'agente ripete in modo sistematico in certi tipi di situazioni. La seconda sono i workflow convergenti: percorsi che agenti diversi, lavorando indipendentemente, tendono a seguire per risolvere lo stesso tipo di problema, il che suggerisce che quel percorso funziona meglio degli altri. La terza sono le preferenze condivise: pattern di preferenza che emergono in modo coerente nel contesto specifico dell'azienda o del team.

Il developer mantiene il controllo sul processo in due modi. Può configurarlo in modalità automatica, dove le modifiche alla memoria vengono applicate direttamente dopo ogni ciclo di dreaming. Oppure può scegliere la modalità di revisione, dove il sistema produce una bozza delle modifiche proposte che il team può esaminare, approvare o modificare prima che vengano applicate. La memoria è memorizzata come file su filesystem, esportabile e modificabile via API o attraverso la Claude Console.

Memory e dreaming: la differenza che conta

La memory persistente per i Managed Agents era già entrata in public beta il 23 aprile 2026. Permette agli agenti di catturare informazioni durante una sessione e renderle disponibili in quelle successive. È un passo avanti significativo rispetto alla memoria di sessione, ma ha un limite: ogni agente cattura quello che impara nel proprio contesto, senza un processo sistematico di analisi e consolidamento.

La differenza tra memory e dreaming è la stessa che esiste tra prendere appunti e rileggerli con attenzione. Memory è il momento in cui l'agente registra qualcosa che ha imparato mentre lavora. Dreaming è il processo con cui quella registrazione viene rivista, organizzata, e integrata con quello che è stato imparato in altre sessioni. Memory accumula. Dreaming consolida.

Insieme, le due funzioni formano un sistema di memoria completo. Memory garantisce che ogni sessione possa lasciare traccia. Dreaming garantisce che queste tracce vengano elaborate in modo da produrre apprendimento reale, invece di accumularsi come un archivio non strutturato.

I risultati reali: Harvey e gli altri

Harvey è una piattaforma AI specializzata nel lavoro legale: drafting di documenti complessi, analisi di contratti, coordinamento di workflow di revisione. Ha adottato i Managed Agents di Claude per coordinare task che richiedono ragionamento su lunghi documenti e interazione con più tool specializzati.

Il problema che Harvey aveva prima del dreaming era specifico: gli agenti incontravano regolarmente problemi su certi formati di file e su certi pattern di interazione con i tool. Ogni volta, trovavano workaround in sessione. Ma il workaround non veniva ricordato: la sessione successiva, lo stesso problema richiedeva lo stesso workaround dall'inizio. Con il dreaming attivo, i pattern di soluzione vengono estratti e integrati nella memoria. I completion rate nei test di Harvey sono saliti di circa sei volte.

Netflix usa i Managed Agents con orchestrazione multi-agente per analizzare log da centinaia di build, con l'obiettivo di identificare pattern ricorrenti nei fallimenti. Wisedocs, che lavora su verifica e qualità di documenti, riporta una riduzione del 50% nei tempi di revisione e una riduzione del 97% degli errori al primo passaggio. Rakuten e Ando sono tra gli altri early adopter, con risultati in corso di documentazione.

I numeri di Harvey sul 6x di completion rate meritano una nota di contesto: si tratta di test interni su un workflow specifico, non di un benchmark generalizzabile. Ogni processo ha le sue caratteristiche, e il beneficio del dreaming dipende molto dalla frequenza degli errori ricorrenti e dalla variabilità del workflow. Ma la direzione del risultato è chiara: un agente che consolida quello che impara tra una sessione e l'altra performa meglio di uno che ricomincia da zero ogni volta.

Cosa significa per chi costruisce workflow AI aziendali

Il cambiamento pratico più importante non è tecnico: è di responsabilità. Finora, chiunque usasse un agente AI su un processo aziendale era anche responsabile dell'ottimizzazione manuale di quell'agente. Analisi dei log, identificazione dei pattern di errore, aggiornamento delle istruzioni, test delle modifiche. Un ciclo di manutenzione che richiedeva competenze specifiche e tempo regolare.

Con il dreaming, una parte di questo ciclo diventa automatica. L'agente produce da solo una versione aggiornata della sua memoria sulla base di quello che ha visto. Il team mantiene il controllo (può scegliere di rivedere le modifiche prima dell'applicazione), ma non deve più fare il lavoro analitico di identificazione dei pattern. Quel lavoro lo fa il sistema.

Per chi costruisce workflow AI su processi ad alto volume, la differenza è di scala. Un agente che gestisce centinaia di sessioni a settimana produce pattern con una frequenza che un team umano non può analizzare manualmente in modo sistematico. Il dreaming rende possibile sfruttare quel volume di dati per migliorare l'agente, senza che la manutenzione diventi a sua volta un progetto a tempo pieno.

Un punto che vale la pena considerare riguarda i workflow multi-agente. Quando più agenti lavorano in parallelo sullo stesso tipo di task, il dreaming può estrarre i pattern che emergono dalla convergenza indipendente di più agenti: i workflow che diversi agenti trovano autonomamente tendono a essere quelli che funzionano meglio. Questo tipo di apprendimento collettivo non sarebbe visibile analizzando i log di un singolo agente.

Come accedere e cosa aspettarsi

Il dreaming è disponibile in research preview su Claude Managed Agents a partire dal 6 maggio 2026. L'accesso è su richiesta: i developer possono richiederlo attraverso la piattaforma Claude. La memory persistente è invece già in public beta e disponibile senza richiesta specifica per chi usa i Managed Agents.

Due funzionalità che erano in research preview sono state promosse a public beta nella stessa data: outcomes (la capacità dell'agente di valutare il risultato delle proprie azioni rispetto a un obiettivo) e l'orchestrazione multi-agente (la capacità di coordinare più agenti su task complessi). Questi tre aggiornamenti insieme costituiscono un'evoluzione significativa dell'infrastruttura per chi costruisce su Claude Managed Agents.

Il profilo di adottante più adatto al dreaming in questa fase è chi usa già agenti su workflow con volume sufficiente a produrre pattern significativi: almeno alcune decine di sessioni a settimana sullo stesso tipo di task, con una certa varietà nei casi incontrati. Workflow troppo standardizzati non producono abbastanza variazione per estrarre pattern utili. Workflow ad alto volume e alta variabilità sono quelli dove il dreaming dà il contributo maggiore.

Conclusione

Il dreaming non è un aggiornamento cosmético. È il primo passo concreto verso agenti AI che si auto-ottimizzano sul contesto specifico di un'azienda, senza richiedere cicli di manutenzione manuale per ogni miglioramento. Il risultato di Harvey (6x di completion rate) è un dato su un workflow specifico, ma indica una direzione reale: agenti che imparano dalle loro sessioni passate perché hanno un sistema per farlo.

Per chi costruisce sull'ecosistema Claude, questo cambia il calcolo sul valore di lungo periodo di un agente. Non si tratta più solo di quanto è bravo oggi, ma di quanto migliorerà nel tempo man mano che accumula sessioni sul tuo workflow specifico. È la differenza tra uno strumento e qualcosa che assomiglia più a un collaboratore che cresce con il lavoro che fa.

Se stai costruendo workflow su Claude Managed Agents o stai valutando di farlo, scrivimi direttamente.

Le domande più comuni

Cos'è esattamente il "dreaming" di Claude e quando viene eseguito?
Dreaming è un processo schedulato che viene eseguito tra le sessioni attive, non durante. Legge i transcript delle sessioni passate e il memory store corrente dell'agente, identifica pattern ricorrenti (errori, workflow convergenti, preferenze condivise), e produce una versione aggiornata e riorganizzata della memoria. La frequenza di esecuzione è configurabile dal developer.

Qual è la differenza tra memory e dreaming nei Claude Managed Agents?
Memory permette all'agente di catturare informazioni durante una sessione e renderle disponibili nelle sessioni successive. Dreaming è il processo che consolida quelle informazioni tra una sessione e l'altra: elimina duplicati, aggiorna informazioni obsolete, e estrae pattern che non sono visibili guardando una singola sessione. Memory accumula, dreaming consolida.

Il dreaming modifica automaticamente il comportamento dell'agente?
Solo se configurato in modalità automatica. In alternativa, il developer può scegliere la modalità di revisione: il dreaming produce una bozza delle modifiche proposte alla memoria, che il team può esaminare e approvare prima che vengano applicate. La memoria è memorizzata come file su filesystem, esportabile e modificabile anche manualmente.

Quali aziende stanno già usando il dreaming con risultati documentati?
Harvey, la piattaforma AI per il lavoro legale, ha riportato un aumento dei completion rate di circa 6 volte nei propri test. Wisedocs riporta una riduzione del 50% nei tempi di revisione documentale e una riduzione del 97% degli errori al primo passaggio. Netflix usa i Managed Agents con orchestrazione multi-agente per l'analisi di log di build a larga scala.

Il dreaming è disponibile per tutti o solo per alcuni sviluppatori?
Al momento del lancio, il 6 maggio 2026, il dreaming è in research preview con accesso su richiesta attraverso la piattaforma Claude. La memory persistente è invece in public beta e accessibile senza richiesta specifica. Le funzionalità outcomes e orchestrazione multi-agente sono state promosse da research preview a public beta nella stessa data.

Che tipo di workflow beneficia di più dal dreaming?
I workflow con volume sufficiente a produrre pattern significativi: almeno alcune decine di sessioni a settimana sullo stesso tipo di task, con una certa variabilità nei casi incontrati. Workflow multi-agente (dove più agenti lavorano in parallelo sullo stesso tipo di task) sono particolarmente adatti, perché il dreaming può estrarre pattern dalla convergenza indipendente di più agenti. Workflow troppo standardizzati producono poca variazione utile.