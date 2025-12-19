OpenAI introduce GPT-5.2-Codex, definendolo il modello di codifica agentica più avanzato mai distribuito dall’azienda per l’ingegneria del software professionale e la cybersecurity difensiva. Si tratta di una versione di GPT-5.2 ulteriormente ottimizzata per l’uso in Codex, progettata per operare in contesti complessi e su orizzonti temporali estesi.

Codifica agentica più potente e contesto compattato

Secondo OpenAI, GPT-5.2-Codex migliora sensibilmente la gestione di attività di lunga durata grazie alla compattazione nativa del contesto e a un uso più efficiente dei token nel ragionamento. Il modello mostra prestazioni superiori nelle modifiche di codice su larga scala, come refactoring e migrazioni, e offre un supporto più affidabile agli ambienti Windows nativi.

Prestazioni di riferimento nei benchmark

OpenAI evidenzia risultati all’avanguardia nei benchmark SWE-Bench Pro e Terminal-Bench 2.0, progettati per valutare le capacità agentiche in ambienti terminali realistici. In questi test, GPT-5.2-Codex dimostra una maggiore efficacia nella navigazione dei repository, nella generazione di patch e nella gestione di flussi di lavoro complessi tipici dell’ingegneria del software reale.

In SWE-Bench Pro, viene fornito un repository di codice a un modello, che deve generare una patch per risolvere un compito di ingegneria del software realistico. Terminal-Bench 2.0 è un benchmark per testare agenti di intelligenza artificiale in ambienti terminali autentici. Le attività includono la compilazione di codice, l’addestramento di modelli e la configurazione di server.

Cybersecurity difensiva: un salto di qualità

Con l’avanzare dei modelli lungo la frontiera dell’intelligenza artificiale, OpenAI osserva un incremento diretto delle capacità in ambiti specializzati come la cybersecurity. GPT-5.2-Codex viene descritto come il modello con le capacità cibernetiche più avanzate finora distribuite dall’azienda, in grado di supportare attività di sicurezza difensiva su larga scala.

Il caso React e la ricerca sulle vulnerabilità

A supporto di questa tesi, OpenAI richiama un episodio recente: un ricercatore di sicurezza, utilizzando GPT-5.1-Codex-Max con Codex CLI, ha individuato tre vulnerabilità in React, successivamente divulgate in modo responsabile. Il caso dimostra, secondo l’azienda, come i sistemi di AI agentica possano accelerare il passaggio dall’ipotesi alla vulnerabilità validata in software ampiamente utilizzati.

Più capacità, più responsabilità

OpenAI riconosce che l’aumento delle capacità di cybersecurity comporta anche nuovi rischi di uso improprio. Sebbene GPT-5.2-Codex non raggiunga ancora il livello “Alto” nel framework di preparazione dell’azienda, la distribuzione è stata pianificata tenendo conto dell’evoluzione futura dei modelli e della necessità di salvaguardie più robuste.

La valutazione del Capture-the-Flag (CTF) Professionale misura la frequenza con cui il modello riesce a risolvere sfide avanzate e multi-step del mondo reale (che richiedono competenze di livello professionale in cybersecurity) in un ambiente Linux.

Distribuzione graduale e accesso controllato

Il modello è disponibile in Codex CLI, nell’estensione IDE, nel cloud e nella revisione del codice per tutti gli utenti ChatGPT a pagamento. Parallelamente, OpenAI sta lavorando all’abilitazione sicura dell’accesso via API per terze parti e allo sviluppo di un programma di accesso controllato dedicato alla cyberdifesa.

Un programma per i professionisti della sicurezza

Il programma pilota di accesso controllato è pensato per professionisti verificati e organizzazioni con un chiaro caso d’uso in ambito cybersecurity. L’obiettivo è consentire attività difensive autorizzate – come analisi di malware, ricerca di vulnerabilità e test di resilienza – mantenendo controlli rigorosi e una stretta collaborazione con la comunità della sicurezza.

Verso la nuova frontiera dell’ingegneria del software

In conclusione, OpenAI presenta GPT-5.2-Codex come un passo decisivo nel supporto dell’ingegneria del software e della cybersecurity nel mondo reale. Attraverso una distribuzione graduale e responsabile, l’azienda punta a massimizzare l’impatto difensivo dell’AI, riducendo al contempo i rischi e preparando il terreno per i futuri modelli ancora più avanzati.