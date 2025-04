Google Gemini 2.5 è il modello di intelligenza artificiale più avanzato di “big G”. La prima versione 2.5 è una versione sperimentale di 2.5 Pro, che si posiziona all’avanguardia in una vasta gamma di benchmark e debutta al primo posto nella LMArena con un margine significativo. I modelli Gemini 2.5 sono definiti “modelli pensanti”, capaci di elaborare i propri pensieri prima di fornire una risposta, il che si traduce in una performance potenziata e una maggiore accuratezza. Nel campo dell’intelligenza artificiale, la capacità di “ragionamento” di un sistema va oltre la semplice classificazione e predizione; implica la sua abilità nell’analizzare informazioni, trarre conclusioni logiche, integrare contesto e sfumature e prendere decisioni informate.

Disponibilità e prospettive future

Presentato il 28 marzo 2025, il 30 marzo Google ha annunciato la distribuzione di Gemini 2.5 Pro Experimental anche per gli utenti che non hanno sottoscritto un piano a pagamento. Il modello può essere selezionato direttamente tramite l’interruttore presente nel chatbot su desktop. La mossa di Google sembra essere una risposta alla concorrenza agguerrita con ChatGPT di OpenAI.

Gli sviluppatori e le aziende possono iniziare a sperimentare con Gemini 2.5 Pro in Google AI Studio. Sarà disponibile su Vertex AI nelle prossime settimane.

La famiglia del modelli Gemini 2

Gemini 2.5 Pro: un nuovo standard per compiti complessi

Gemini 2.5 Pro Experimental è il modello più avanzato di Google per affrontare compiti complessi. Supera la classifica LMArena, che misura le preferenze umane, con un margine significativo, indicando un modello altamente capace e dotato di uno stile di alta qualità. 2.5 Pro dimostra anche solide capacità di ragionamento e codifica, primeggiando nei comuni benchmark di codifica, matematica e scienze.

Aggiornato il 26 marzo con le nuove valutazioni MRCR (Multi Round Coreference Resolution)

Ragionamento avanzato: performance statistiche nei benchmark chiave

Gemini 2.5 Pro è all’avanguardia in una serie di benchmark che richiedono un ragionamento avanzato. Senza tecniche di test che aumentano i costi, come il “majority voting”, 2.5 Pro è in testa nei benchmark di matematica e scienze come GPQA e AIME 2025. Ottiene anche un punteggio all’avanguardia del 18,8% tra i modelli senza l’uso di strumenti su Humanity’s Last Exam, un dataset progettato da centinaia di esperti in materia per catturare la frontiera umana della conoscenza e del ragionamento.

Codifica avanzata: un salto di qualità rispetto a Gemini 2.0

Google si è concentrata sulle prestazioni di codifica, e con Gemini 2.5 ha compiuto un grande passo avanti rispetto a 2.0, con ulteriori miglioramenti in arrivo. 2.5 Pro si comporta egregiamente nella creazione di applicazioni web visivamente accattivanti e applicazioni di codice agentiche, oltre alla trasformazione e all’editing del codice.

Su SWE-Bench Verified, lo standard industriale per le valutazioni di codice agentico, Gemini 2.5 Pro ottiene un punteggio del 63,8% con una configurazione di agente personalizzata. Un esempio di come 2.5 Pro possa utilizzare le sue capacità di ragionamento è la creazione di un videogioco producendo il codice eseguibile da un semplice prompt.

Gemini 2.5: Create your own dinosaur game from a single line prompt

Guarda questo video su YouTube

Basato sul meglio di Gemini: multimodalità nativa e finestra di contesto estesa

Gemini 2.5 Pro si basa su ciò che rende unici i modelli Gemini: la multimodalità nativa e una lunga finestra di contesto. 2.5 Pro viene rilasciato con una finestra di contesto di 1 milione di token (2 milioni in arrivo), con prestazioni elevate che migliorano rispetto alle generazioni precedenti. Può comprendere vasti set di dati e gestire problemi complessi provenienti da diverse fonti di informazione, tra cui testo, audio, immagini, video e persino interi repository di codice.

Gemini 2.5: Code a visualization of a Mandelbrot set

Guarda questo video su YouTube