Questo lunedì 24 novembre 2025 Anthropic ha presentato Claude Opus 4.5, definendolo il suo modello più avanzato in termini di coding, capacità agentiche e usabilità multimodale. Il lancio include importanti novità come le integrazioni integrate in Chrome ed Excel, oltre a miglioramenti significativi nella memoria contestuale e nella gestione dei flussi di lavoro continuativi, come le conversazioni “infinite” per utenti a pagamento.
Performance, benchmark e memoria avanzata
Opus 4.5 si distingue per eccellenti risultati su benchmark di riferimento: ha superato l’80 % su SWE‑Bench Verified per le attività di coding, un traguardo mai raggiunto prima da nessun altro modello.
A questo si aggiungono punteggi elevati in benchmark come Terminal‑bench, tau2‑bench, MCP Atlas, ARC‑AGI 2 e GPQA Diamond.
Sul fronte architetturale, Anthropic ha introdotto significativi miglioramenti nella memoria: il modello comprime dinamicamente il contesto per supportare conversazioni prolungate senza interruzioni (“endless chat”). Come spiegato da Dianne Na Penn, responsabile del product management ricerca, «sapere cosa ricordare è fondamentale, più di avere semplicemente un contesto più lungo».
Integrazioni operative: Chrome, Excel e Claude Code
Con Opus 4.5 arriva l’espansione delle integrazioni nei flussi di lavoro quotidiani: Claude for Chrome è ora disponibile a tutti gli utenti Max, permettendo all’AI di interagire direttamente con applicazioni web.
Parallelamente, la versione per Excel entra in una fase più ampia di disponibilità su piani Max, Team e Enterprise: questo consente operazioni come generazione automatica di fogli, analisi complesse e modellazione finanziaria.
In aggiunta, è stata lanciata una nuova app desktop chiamata Claude Code, disponibile per Windows e macOS, che potenzia le capacità di pianificazione, esecuzione parallela di sessioni di ricerca e debugging rispetto alle versioni precedenti.
Sicurezza, allineamento e costi
Anthropic descrive Opus 4.5 come il modello più sicuro e allineato della sua storia, con protezioni contro attacchi come prompt‑injection e gestione migliorata di input potenzialmente ingannevoli. Il pricing della versione via API parte da 5 $ per milione di token di input e 25 $ per milioni di output, con opportunità di risparmio fino al 90 % grazie al prompt caching o fino al 50 % con l’elaborazione batch.
Contesto competitivo e rilevanza strategica
Il debutto di Opus 4.5 avviene in un contesto competitivo sempre più agguerrito: OpenAI ha lanciato GPT 5.1 il 12 novembre e Google Gemini 3 il 18 novembre 2025.
Anthropic mira a proporre un modello che domini non solo in capacità di ragionamento e codice, ma anche nell’integrazione operativa nei tool quotidiani, distinguendosi per flessibilità e capacità avanzate.