Anthropic annuncia il debutto di Claude Opus 4.5, descritto come il suo modello più avanzato e versatile. Il sistema si distingue per prestazioni elevate nella programmazione, nella gestione di agenti software e nell’utilizzo del computer, oltre a miglioramenti evidenti in compiti quotidiani come la ricerca approfondita e la gestione di slide e fogli di calcolo. Secondo l’azienda, rappresenta un assaggio dei cambiamenti che l’intelligenza artificiale apporterà al lavoro del futuro.
Indice degli argomenti:
Prestazioni da primato nella software engineering
Claude Opus 4.5 raggiunge risultati all’avanguardia nei test di ingegneria del software, superando i principali modelli concorrenti. È già disponibile tramite app, API e sulle tre principali piattaforme cloud. Gli sviluppatori possono accedervi come claude-opus-4-5-20251101, con un nuovo prezzo di 5/25 dollari per milione di token, pensato per rendere le capacità Opus più accessibili.
Parallelamente, Anthropic aggiorna la Developer Platform, Claude Code e le sue app consumer, introducendo strumenti per agenti a lunga esecuzione e nuove integrazioni con Excel, Chrome e desktop.

Prime impressioni e feedback interni
Durante i test pre-rilascio, i dipendenti di Anthropic hanno evidenziato la capacità del modello di gestire ambiguità e valutare compromessi senza assistenza. Hanno notato come Opus 4.5 individui soluzioni a bug complessi e affronti compiti considerati impossibili per Sonnet 4.5 poche settimane prima.
Anche i clienti con accesso anticipato hanno confermato impressioni simili, sottolineando la capacità del modello di risolvere problemi sofisticati con un ragionamento più naturale.
Un modello che supera anche i candidati umani
Nel suo processo interno di selezione per ingegneri, Anthropic utilizza un difficile esame da svolgere in due ore. Claude Opus 4.5 ha ottenuto il punteggio più alto mai registrato, superando qualsiasi candidato umano valutato finora. L’azienda precisa che il test misura solo competenze tecniche e non abilità come comunicazione o collaborazione, ma i risultati sollevano interrogativi sull’impatto dell’AI nelle professioni tecniche.

Miglioramenti globali: visione, ragionamento e matematica
Oltre all’ingegneria del software, il modello mostra progressi in visione, ragionamento e matematica.
Su SWE-bench Multilingual guida in 7 linguaggi di programmazione su 8. In scenari agentici – come l’assistenza a un cliente aereo con vincoli di prenotazione – Opus 4.5 dimostra creatività nel trovare soluzioni legittime ma non previste dai benchmark, evidenziando una forma di ragionamento non banale.


Sicurezza e robustezza: un passo avanti
Anthropic definisce Opus 4.5 il suo modello più allineato e sicuro. Ha mostrato livelli record nella resistenza a prompt injection sofisticati, un’area cruciale per clienti che utilizzano AI in contesti sensibili e a rischio di attacchi malevoli. L’azienda pubblica valutazioni complete nella sua system card ufficiale.

Nuovi strumenti nella Developer Platform
Con l’introduzione del parametro effort, gli sviluppatori possono scegliere tra rapidità ed economicità oppure massima capacità di ragionamento. A parità di qualità, Opus 4.5 utilizza drasticamente meno token rispetto a Sonnet 4.5.
Grazie a tecniche come compattazione del contesto, memoria avanzata e gestione di sub-agent, il modello migliora sensibilmente nelle attività di ricerca profonda, con un incremento di quasi 15 punti percentuali nei test interni.

Aggiornamenti di prodotto: Claude Code, app e integrazioni
Claude Code riceve migliorie nella creazione di piani esecutivi e nella gestione di più sessioni parallele, anche su desktop. Gli utenti dell’app Claude possono ora sostenere conversazioni molto più lunghe, grazie alla sintesi automatica del contesto precedente.
Claude per Chrome diventa disponibile per tutti gli utenti Max, mentre l’integrazione con Excel si estende a Max, Team ed Enterprise. Anthropic rimuove i limiti specifici di Opus per gli utenti con accesso al modello e aumenta le soglie di utilizzo per chi ha piani premium.







