
La maggior parte degli sviluppatori che cercano di costruire agenti di intelligenza artificiale iniziano con un unico grande ciclo di modelli linguistici - un prompt di sistema e forse uno o due strumenti - e per i piccoli compiti è sufficiente.
Ma quando si vuole una struttura, il sistema inizia a sfilacciarsi. I risultati diventano imprevedibili, i flussi di lavoro diventano difficili da debuggare e si bruciano gettoni sulla ripetizione invece che sul progresso.
I flussi di lavoro multi-agente consentono di creare agenti di intelligenza artificiale che si comportano più come un team con ruoli chiari e visibilità sulle decisioni prese e che lavorano per lo stesso obiettivo.
Che cos'è un quadro multi-agente?
Un framework multi-agente è l'infrastruttura che si usa per costruire, eseguire e gestire più agenti AI in modo coordinato.
È l'infrastruttura che gestisce il modo in cui gli agenti comunicano e come le attività si muovono tra di loro.
Se si lavora con sistemi multi-agente, il quadro è ciò che li rende operativi.
Nel suo nucleo, trasforma i modelli linguistici grezzi di grandi dimensioniLLMs) in agenti con un ruolo e un modo prevedibile di operare.
Invece di scrivere la logica di orchestrazione da zero, il framework offre struttura, controllo e ripetibilità.
Quadri multi-agente: Concetti chiave
Come funzionano i quadri multi-agente?
I framework multi-agente strutturano il modo in cui gli agenti vengono attivati, il modo in cui si passano i dati e il modo in cui il sistema tiene traccia dei progressi.
Forniscono gli elementi costitutivi per coordinare gli agenti in modo tale da scalare con la complessità e renderli utilizzabili nelle implementazioni del mondo reale.
Un esempio è l'utilizzo di una configurazione multi-agente per alimentare un chatbotWhatsApp . In questo caso, diversi agenti possono gestire attività come la prenotazione, l'elaborazione dei rimborsi o la verifica, lavorando insieme dietro le quinte senza affidarsi a una configurazione monolitica del bot.
.webp)
Gli agenti sono registrati come componenti richiamabili nel sistema.
Prima che un agente possa fare qualcosa, il framework deve sapere che esiste. Questo significa dire al sistema il nome dell'agente, di cosa è responsabile e a quali strumenti o informazioni può accedere.
Nella maggior parte dei framework, questa impostazione avviene tramite un file di configurazione o del codice, in cui si definisce il ruolo di ogni agente e come attivarlo. Ad esempio, si potrebbe dire al sistema:
"Questo è il pianificatore. Legge gli input dell'utente e decide cosa fare dopo".
"Questo è il verificatore. Prende le informazioni dell'utente e restituisce booking_id e informazioni sull'utente".
Una volta registrati, il framework è in grado di "chiamare" questi agenti per nome, ovvero sa come eseguirli quando è il loro turno nel flusso di lavoro.
L'agente di routing decide quale agente eseguire successivamente
Un agente pianificatore o una funzione di controllo gestisce l'instradamento degli agenti AI. Esamina l'ultimo output del bot, la cronologia della conversazione corrente e talvolta l'input originale dell'utente per decidere cosa deve accadere successivamente.
Alcuni pianificatori sono basati su prompt: ricevono un messaggio di sistema e forniscono il nome dell'agente successivo da eseguire.
Altri utilizzano logiche codificate o grafici di flusso, a seconda dei framework di agenti AI con cui si lavora.
Il framework prende l'output e lo usa per chiamare l'agente successivo. Il router decide chi deve svolgere il compito, piuttosto che svolgere il compito.
I dati vengono passati tra gli agenti tramite messaggi
Gli agenti non condividono direttamente la memoria. Quando uno termina l'esecuzione, il suo output viene impacchettato in un messaggio, di solito un dizionario o un oggetto JSON, e passato all'agente successivo come input.
Il framework gestisce il trasferimento. Memorizza il messaggio in uno spazio di memoria condiviso o lo passa direttamente all'interfaccia di input dell'agente successivo, a seconda di come è strutturato il sistema.
I messaggi spesso non si limitano al contenuto:
- Chi lo ha inviato (agente o utente)
- Da dove proviene il flusso di lavoro
- Come deve essere utilizzato (ad esempio, trigger, input, decisione)
- Metriche opzionali come il conteggio dei token o i timestamp
Questo contesto aiuta il sistema a instradare i compiti in modo pulito e a mantenere gli agenti disaccoppiati gli uni dagli altri.
L'esecuzione viene monitorata utilizzando lo stato del flusso di lavoro e i trigger.
Il framework tiene traccia di ciò che è accaduto finora: quali agenti hanno eseguito, cosa hanno restituito e cosa deve ancora accadere. Tutto questo viene memorizzato in un oggetto Stato, che viene aggiornato dopo ogni passo.
I trigger decidono cosa succede dopo. Utilizzano valori di uscita o condizioni per ramificare il flusso.
Ciò consente al sistema di avanzare senza codificare la logica in ogni agente. È lo stato a guidare il flusso di lavoro, non gli agenti stessi.
Vantaggi principali dell'utilizzo di framework multi-agente
Scalare la logica senza sovraccaricare un singolo agente
Un singolo agente di intelligenza artificiale può fare solo un po' di cose prima di trasformarsi in una confusione di suggerimenti, strumenti e responsabilità poco chiare. I framework multi-agente consentono di suddividere la logica in agenti mirati, ciascuno dei quali gestisce un compito chiaro.
Invece di ridurre un singolo agente, è possibile assegnare fasi specifiche, come il recupero, la convalida o l'esecuzione, ad agenti separati e far crescere il sistema pezzo per pezzo.
Debug della collaborazione tra agenti con piena visibilità
Quando gli agenti di intelligenza artificiale lavorano insieme, i problemi possono essere difficili da rintracciare. I framework mostrano cosa ha ottenuto ciascun agente, cosa ha restituito e dove si è bloccato.
Non si indovina cosa si è rotto, ma si ispeziona il passaggio di consegne e lo si risolve direttamente. Questo tipo di visibilità è ciò che rende gestibile la collaborazione tra agenti AI.
Riutilizzare gli agenti nei vari flussi di lavoro
Se un agente funziona, riutilizzatelo. I framework consentono di inserire lo stesso agente in flussi diversi senza doverlo riscrivere. In questo modo si mantiene la coerenza e si velocizzano i test.
Ad esempio, un agente di convalida che controlla gli input dell'utente o l'autenticazione può essere utilizzato sia nei chatbot di assistenza clienti che in quelli di prenotazione, dove si applica la stessa logica.
Gestione automatica dei guasti e dei tentativi di risposta
Quando un agente fallisce, il framework può riprovare, saltare o andare avanti. Non è necessario scrivere questa logica da soli.
Il fallback incorporato rende i flussi di lavoro più affidabili senza bisogno di lavoro aggiuntivo, e questo tipo di affidabilità è ciò che alimenta i sistemi del mondo reale.
Costruire flussi di agenti facili da modificare
Quando si suddividono i compiti tra gli agenti, non è necessario rielaborare l'intero sistema ogni volta che cambia qualcosa.
È possibile aggiornare un pianificatore senza toccare l'esecuzione o cambiare la risposta di un agente senza riscrivere il resto.
La facilità di accesso paga: secondo i dati di Salesforce, i team che utilizzano l'IA agenziale risparmiano 11 ore per dipendente ogni settimana, grazie anche all'adattabilità dei flussi di lavoro.
I 5 principali framework multi-agente
La scelta di un framework multi-agente dipende da ciò che si sta costruendo e da quanto controllo si vuole sul modo in cui gli agenti si comportano, comunicano e si riprendono dai guasti.
I migliori framework offrono diversi compromessi: alcuni sono ottimi per i flussi di lavoro strutturati, altri offrono maggiore flessibilità a scapito della chiarezza.
È necessario un sistema che corrisponda alle esigenze del team e alla portata che si intende raggiungere.
1. Botpress
.webp)
Botpress è una piattaforma di sviluppo visuale per la creazione di agenti AI in grado di coordinarsi attraverso fasi, ruoli e canali.
Invece di cablare la logica nel codice, si definisce il comportamento degli agenti utilizzando flussi, memoria, condizioni e chiamate a strumenti.
Il comportamento degli agenti multipli si basa su istruzioni, flussi di lavoro e strumenti esterni. Ogni nodo di un flusso Botpress agisce come un'unità focalizzata, con le proprie istruzioni e il proprio ambito.
È possibile suddividere il ragionamento su più nodi autonomi e statici, aggiungere livelli di convalida o instradare l'input dell'utente attraverso una logica decisionale basata su strumenti, invece di gestire tutto in un'unica fase.
La memoria è assegnata a ciascun flusso, in modo che gli agenti utilizzino solo ciò di cui hanno bisogno. Gli ingressi e le uscite sono chiaramente definiti e le chiamate agli strumenti possono essere aggiunte direttamente tramite le integrazioni integrate.
Caratteristiche principali
- Orchestrazione visiva degli agenti tramite flussi e nodi
- Memoria distribuita e controllo delle variabili tra i nodi
- Memoria multigiro, logica di fallback e ritentativi
- Utilizzo dello strumento tramite chiamate API, webhook e inserimento di funzioni
2. Catena di Langhe

LangChain è un framework per lo sviluppatore che permette di costruire applicazioni LLM collegando tra loro catene di prompt, strumenti e memoria.
È iniziato come un modo per strutturare le chiamate LLM con strumenti come la ricerca e i calcolatori, ma si è gradualmente espanso in un ecosistema tentacolare.
Una release ha dato priorità agli "agenti", poi agli "assistenti" e infine ai "runnables". Il risultato è un potente kit di strumenti che può fare quasi tutto, ma che spesso richiede tempo per essere navigato.
È possibile assegnare kit di strumenti e costruire una logica di routing tra gli agenti. Il punto forte è la modularità: i componenti sono riutilizzabili, mescolabili e ben integrati con le API esterne.
Ma si scriverà più codice glue del previsto. E dato che le astrazioni cambiano rapidamente, vale la pena di verificare se il metodo che si sta usando è ancora quello preferito.
Caratteristiche principali
- Concatenazione modulare di prompt, strumenti e memoria
- Integrazione con LLMs, archivi vettoriali e API
- Tracciamento e valutazione facoltativi con LangSmith
3. CrewAI

CrewAI semplifica la creazione di flussi di lavoro multi-agente in cui ogni agente ha un ruolo e un compito definiti. Si crea un equipaggio, si assegnano gli obiettivi e gli agenti si coordinano attraverso un manager condiviso.
È uno dei modi più veloci per modellare la collaborazione tra agenti senza scrivere da zero la logica di orchestrazione.
Ideale per configurazioni come coppie pianificatore-esecutore, flussi di ricercatori-revisori o qualsiasi compito di squadra in cui le responsabilità sono suddivise in modo netto.
Ma quando si inizia ad aggiungere complessità, l'astrazione diventa stretta. C'è meno flessibilità su come e quando gli agenti vengono eseguiti e modificare il comportamento spesso significa uscire dalle impostazioni predefinite del framework.
Caratteristiche principali
- Configurazione degli agenti basata sui ruoli con nomi, obiettivi e memoria
- Supporta l'esecuzione sequenziale e parallela degli agenti
- Memoria condivisa dell'equipaggio per la collaborazione con gli agenti
- Facile integrazione con strumenti, funzioni e prompt personalizzati
4. AutoGPT

AutoGPT è stato il primo progetto a mostrare come ci si comporta quando si dà un obiettivo a un chatbotGPT e lo si lascia libero di agire: pianificare, pensare, ricercare ed eseguire senza l'intervento costante dell'uomo.
L'utente definisce l'obiettivo e AutoGPT esegue un loop attraverso le fasi di ragionamento, crea sotto-obiettivi, richiama strumenti e regola la propria strategia lungo il percorso.
È stato un enorme passo avanti nel rendere il comportamento agonico autonomo e dinamico. Ma non è costruito per la precisione.
Il task loop è fragile e gli agenti tendono a rimanere bloccati nella riscrittura dello stesso piano o a inseguire sottoattività irrilevanti.
Si possono inserire memoria, strumenti e API, ma spesso mettere tutto insieme porta a flussi imprevedibili, difficili da debuggare o da governare.
Caratteristiche principali
- Agente orientato agli obiettivi con capacità di autopromozione e pianificazione dei compiti
- Generazione automatica di sottoattività e ciclo di esecuzione
- Supporta l'uso di strumenti tramite plugin e chiamate API
- Estensibile con script, funzioni e integrazioni personalizzate
5. Autogeno

Autogen è un framework open-source di Microsoft che si concentra sulle conversazioni multi-agente, in cui gli agenti interagiscono attraverso messaggi strutturati e basati su turni.
È particolarmente indicato quando si vuole avere il controllo su ogni scambio, come nei loop di pianificazione ed esecuzione o nei sistemi human-in-the-loop.
L'autogen brilla per trasparenza. È possibile iniettare funzioni a metà del discorso, indirizzare le decisioni attraverso una logica personalizzata e tracciare esattamente ciò che ogni agente ha detto e perché.
Ma la scalabilità richiede lavoro. L'orchestrazione dei messaggi è flessibile, ma non astratta: si devono ancora gestire le cronologie, le configurazioni degli agenti e la logica dei passaggi.
Per le configurazioni di ricerca, i test controllati o il comportamento riproducibile degli agenti, è uno dei framework più precisi in circolazione.
Caratteristiche principali
- Struttura di comunicazione multi-agente a turni
- Supporta agenti human-in-the-loop e function-calling
- Tracciamento trasparente dei messaggi e iniezione di logica personalizzata
Come costruire con un framework multi-agente
Il modo più semplice per iniziare è scegliere un flusso di lavoro reale, già troppo complesso per un singolo agente, e suddividerlo in poche semplici parti.
Pensate a un chatbot per la generazione di lead, a un flusso di prenotazioni o a qualsiasi cosa in cui logica, verifica e azione si aggroviglino.
Assegnate a ogni fase il suo agente, quindi collegatele utilizzando gli strumenti di routing e di messaggistica del framework.
Fase 1: identificare i punti di rottura della logica a singolo agente
Cercate un punto del vostro bot o del vostro sistema in cui le cose hanno iniziato ad accumularsi: lunghe richieste o chiamate di strumenti concatenate che sembrano imbullonate. Questo è il punto di ingresso. Ecco alcuni esempi comuni facili da individuare:
- Un flusso di rimborso che analizza l'input dell'utente, verifica l'ammissibilità, emette il rimborso e invia la conferma, tutto in un unico ciclo.
- Una sequenza di onboarding che raccoglie i dati, convalida i moduli, assegna i tipi di utente e attiva le e-mail in un'unica catena di prompt.
Invece di ridisegnare l'intero sistema, si tratta solo di isolare il flusso di lavoro che già mostra delle crepe.
Passo 2: Definire i ruoli prima di toccare il framework
Una volta individuata la logica disordinata, scomponetela in vere e proprie responsabilità.
Se qualcosa convalida un input, questo è un agente. Se qualcosa gestisce un'azione esterna, è un altro.
Scrivetelo in un linguaggio semplice, quel tanto che basta per far capire dove sono i passaggi di consegne.
Una volta che è tutto davanti a voi, capirete che cosa deve essere separato e che cosa può essere eliminato. Inoltre, si avrà un'idea del tipo di struttura di cui si ha bisogno.
Ogni ruolo deve sembrare qualcosa che si possa testare da solo.
Fase 3: Scegliere il quadro di riferimento
Scegliete una piattaforma che si adatti al vostro stile di flusso di lavoro.
- Visuale: Botpress, se si vogliono flussi basati sui nodi e la memoria di scopo.
- Codice di base: LangChain o CrewAI se vi sentite a vostro agio nel cablare la logica in Python.
Il framework decide come gli agenti vengono registrati, attivati e collegati.
Passo 4: creare il primo flusso di lavoro
Ora trasformate questi ruoli in agenti. Definiteli all'interno del vostro framework: date a ciascuno un nome, il suo lavoro e lo strumento o l'accesso all'API di cui ha bisogno.
Una volta posizionati, collegarli. Per spostarsi da un agente all'altro, utilizzare le rotte fornite dal framework.
L'obiettivo è quello di ottenere un flusso di lavoro completo da un capo all'altro, con agenti che rimangono nella loro corsia.
Fase 5: Esecuzione del sistema e controllo di ogni passaggio di consegne
Attivate l'intero flusso di lavoro, dall'inizio alla fine, e tracciate ciò che accade. Dovreste osservare ciò che ogni agente riceve, ciò che restituisce e se il flusso si muove in modo pulito tra di loro.
Se un agente riceve input confusi, probabilmente avete sbagliato lo scope. Se la logica salta inaspettatamente, il routing deve essere corretto.
Una volta che i passaggi sono puliti, si dispone di un sistema funzionante.
Migliori pratiche per l'utilizzo di framework multi-agente
La scelta di un framework è solo il punto di partenza. Ciò che conta di più è il modo in cui si progettano, si testano e si gestiscono i flussi di lavoro creati con esso.
Man mano che i sistemi di intelligenza artificiale diventano più modulari e autonomi, la tracciabilità diventa più difficile.
Mantenere la logica centrale centralizzata
Evitare di distribuire le decisioni critiche su più agenti. È più facile da mantenere e testare quando i ragionamenti chiave avvengono in un unico luogo, invece di essere suddivisi in parti non collegate tra loro.
Definire in anticipo gli input e gli output dell'agente
Ogni agente deve avere un contratto chiaramente definito: cosa riceve e cosa restituisce. In questo modo è più facile sostituire gli agenti o inserirli in nuovi flussi di lavoro senza interrompere la logica del flusso.
Registra ogni messaggio passato tra gli agenti
Se non si riesce a vedere ciò che gli agenti si dicono, non si può eseguire il debug. Assicurarsi che ogni input e output sia registrato con un contesto sufficiente per risalire al flusso.
Utilizzare la memoria a scope per ridurre il rumore e i costi
Fornite a ogni agente solo il contesto di cui ha bisogno. L'accesso completo alla memoria porta a richieste gonfiate, a un maggiore utilizzo di token e a comportamenti imprevedibili da parte di agenti che dovrebbero essere concentrati.
Iniziare a costruire un'intelligenza artificiale in grado di coordinarsi
La maggior parte dei sistemi crolla nel momento in cui è necessario un vero coordinamento. Botpress vi dà il controllo su come gli agenti si distribuiscono i compiti, con ruoli e logiche definite, che potete testare e comprendere.
Inoltre, consente di passare i dati in modo pulito tra i flussi. È possibile tracciare ogni fase con registri multigiro che mostrano quale strumento è stato chiamato, perché è stato eseguito e come è stato utilizzato nel flusso di lavoro.
Invece di mettere a punto le richieste e controllare le allucinazioni, ci si concentra sulla funzionalità reale, costruendo agenti che si comportano come un software.
Iniziare a costruire oggi è gratuito.
Indice dei contenuti
Condividi questo articolo su: