Anthropic ha condotto un esperimento innovativo, denominato Project Deal, creando un marketplace interno dove agenti AI basati su Claude hanno negoziato beni reali per conto dei dipendenti. L'iniziativa, paragonabile a una versione automatizzata di un sistema di annunci classificati, ha visto ogni partecipante ricevere un budget di 100 dollari in gift card per effettuare transazioni tramite Slack.

Il risultato è stato significativo: sono state concluse 186 transazioni, generando un valore totale di scambi superiore a 4.000 dollari, con effettivi passaggi di beni tra le persone coinvolte.

Organizzazione dell'Esperimento

Il pilot ha coinvolto 69 dipendenti presso la sede di Anthropic a San Francisco. Ogni partecipante ha compilato un'intervista iniziale, mediata da Claude, per esprimere le proprie intenzioni di acquisto o vendita, il prezzo desiderato e lo stile di negoziazione preferito. Sulla base di queste informazioni, è stato sviluppato un agente Claude personalizzato per ciascun utente.

L'esperimento si è svolto su Slack attraverso quattro canali paralleli: uno era il canale "reale", i cui esiti erano effettivamente onorati, mentre gli altri tre erano dedicati allo studio. In due canali sono stati impiegati agenti basati sul modello Claude Opus 4.5, all'avanguardia, mentre negli altri due è stata utilizzata una combinazione di Opus e Haiku 4.5, un modello di capacità inferiore.

I partecipanti sono stati informati solo al termine dell'esperimento su quale canale fosse quello reale e quale modello fosse stato utilizzato.

Performance e Differenze tra Modelli

L'obiettivo principale era valutare se i modelli AI più avanzati garantissero performance superiori nelle negoziazioni. I dati hanno confermato questa ipotesi: i partecipanti rappresentati dai modelli più potenti hanno ottenuto risultati oggettivamente migliori. Gli agenti basati su Claude Opus 4.5 hanno concluso in media 2,07 transazioni in più rispetto agli agenti meno performanti.

Un aspetto notevole emerso è che coloro rappresentati da modelli meno potenti spesso non hanno percepito il proprio svantaggio nelle negoziazioni, non accorgendosi della differenza nelle performance.

Accettazione e Potenziale di Mercato

I partecipanti hanno mostrato un elevato entusiasmo per l'iniziativa: quasi la metà ha dichiarato che sarebbe disposta a pagare per un servizio simile in futuro. Questo esperimento dimostra la praticabilità operativa di un'architettura basata su agenti AI negozianti e la sua buona accoglienza da parte degli utenti, anche in contesti di scambio economico reale.

Oltre all'aspetto operativo, il valore strategico di Project Deal risiede nel mostrare come l'evoluzione dei modelli Claude possa influenzare direttamente i risultati economici e la percezione umana di questi strumenti.

Prospettive Future e Implicazioni

Project Deal rappresenta una prova tangibile del potenziale per il commercio agent-to-agent, ovvero scenari in cui sistemi di intelligenza artificiale negoziano autonomamente tra loro per conto degli utenti.

Anthropic suggerisce che siamo vicini a mercati reali dove agenti autonomi interagiranno in modo strutturato e automatizzato.

L'esperimento solleva importanti interrogativi etici e tecnologici, rendendo necessaria una valutazione attenta della regolamentazione, della trasparenza e del controllo in un futuro in cui decisioni economiche critiche potrebbero essere delegate quasi interamente ad agenti AI.

In termini strategici, questi risultati possono orientare lo sviluppo di soluzioni aziendali automatizzate per l'approvvigionamento, i marketplace e le negoziazioni B2B, accelerando l'adozione di agenti AI personalizzati nel contesto imprenditoriale.

Anthropic riafferma la sua leadership nell'AI agentica sperimentale, offrendo una visione chiara su modelli che non si limitano a eseguire compiti, ma rappresentano attivamente i loro utenti in contesti economici reali.

Il successo di Project Deal, sebbene condotto con un campione limitato, evidenzia che l'integrazione di agenti AI nei mercati reali non è più una visione futuristica, ma una realtà in rapida evoluzione, destinata a ridefinire le interazioni, le negoziazioni e la fiducia nell'era dell'intelligenza artificiale.