Il centro dell’annuncio è Gemini 3.5 Flash, presentato come il primo tassello di una nuova famiglia di modelli “frontier intelligence with action”, cioè intelligenza di frontiera unita alla capacità di fare. Nel testo diffuso da Google DeepMind, l’azienda sostiene che 3.5 Flash è il suo modello più forte finora per attività agentiche e coding, con prestazioni superiori a Gemini 3.1 Pro su benchmark come Terminal-Bench 2.1, GDPval-AA, MCP Atlas e CharXiv Reasoning. Nel materiale di Google, il modello viene anche descritto come quattro volte più veloce di altri frontier model in termini di token generati al secondo.

La scelta lessicale non è secondaria. Google non sta vendendo soltanto una nuova versione di Gemini. Sta cercando di imporre una definizione del mercato: l’AI utile non è quella che risponde bene a una domanda, ma quella che porta a termine sequenze di azioni e si integra nei processi di lavoro.
È un passaggio che ha un peso economico diretto, perché sposta il confronto dai soli benchmark generalisti alla produttività aziendale, al software development, alla preparazione di documenti finanziari e all’automazione di attività che oggi richiedono ore o giorni di lavoro umano. Reuters lega esplicitamente questo lancio al tentativo di frenare i progressi di Anthropic e OpenAI presso la clientela enterprise.

Indice degli argomenti:
Il posizionamento: meno latenza, più lavoro eseguito
Sul piano tecnico, Google insiste su un equilibrio che finora nel settore è stato difficile ottenere: qualità da modello di punta e velocità da modello leggero.
La pagina di DeepMind dedicata a Gemini 3.5 mostra 3.5 Flash davanti a Gemini 3 Flash e a Gemini 3.1 Pro in varie prove di uso agentico:
- 76,2% in Terminal-Bench 2.1 per il coding agentico da terminale,
- 83,6% in MCP Atlas per workflow multi-step,
- 57,9% in Finance Agent v2 per analisi e decisioni finanziarie,
- 84,2% in CharXiv Reasoning per la sintesi di informazioni da grafici complessi. Nello stesso pannello compare un punteggio Elo di 1656 in GDPval-AA, benchmark che Google descrive come misura del lavoro economicamente utile.

È proprio qui che l’annuncio diventa economico più che tecnologico. Un modello rapido ha senso se riduce il costo per attività completata. Google lo dice in modo esplicito nel testo di lancio: attività che per uno sviluppatore potevano richiedere giorni, o per un revisore settimane, possono essere completate in una frazione del tempo e spesso a meno della metà del costo rispetto ad altri modelli di frontiera. Questa è una dichiarazione dell’azienda, non una misurazione indipendente pubblica, ma spiega bene la tesi commerciale: vincere non sul fascino del modello più “intelligente” in assoluto, bensì sul rapporto tra utilità, latenza e prezzo.

Il terreno vero è l’impresa
Google ha accompagnato l’annuncio con casi d’uso industriali.
Nella documentazione DeepMind, Armadin afferma che Gemini 3.5 Flash migliora del 42% rispetto a Gemini 3 Flash su un benchmark cyber a lungo raggio e riduce del 68% l’uso di token.
Box sostiene che 3.5 Flash supera Gemini 3 Flash del 19,6% nella propria valutazione di lavoro enterprise; in più, secondo il Cto Ben Kus, il modello consentirebbe un’accuratezza maggiore del 96,4% in compiti life sciences che richiedono estrazione dati e calcoli, e del 46,7% nella costruzione di report finanziari da dati strutturati per il settore financial services.
Sono numeri forniti dai partner e riportati da Google, quindi vanno letti come evidenze aziendali più che come test indipendenti comparabili. Ma indicano bene a quale domanda Google vuole rispondere: quanta produttività aggiuntiva può generare l’AI dentro i sistemi che le aziende usano già.
Reuters aggiunge un altro tassello: a I/O 2026 Google ha sottolineato di avere reso Gemini più economico per gli utenti corporate e, insieme ai nuovi agenti per Search, ha ritoccato anche l’offerta in abbonamento, abbassando il piano AI Ultra a 200 dollari e introducendo un nuovo tier da 100 dollari.
È una mossa che fa pensare a una pressione competitiva crescente non solo sui modelli, ma sulla monetizzazione. L’AI generativa è ormai un mercato di infrastruttura e distribuzione, non più soltanto di demo.
Search resta il motore del business
Per Alphabet, però, l’enterprise non basta. Il vero asset da difendere è Search, che genera gran parte dei ricavi pubblicitari del gruppo. L’integrazione di Gemini 3.5 Flash nella ricerca non è quindi una semplice estensione di prodotto: è una misura difensiva sul core business.
Google aveva già portato Gemini 3 in AI Mode e in AI Overviews nei mesi precedenti. Con Gemini 3 Flash, e ora con 3.5 Flash, sta accelerando il tentativo di mantenere dentro il proprio ecosistema le ricerche che potrebbero migrare verso interfacce conversazionali concorrenti.
Lo speech del Ceo Sundar Pichai
Al Google I/O 2026 Sundar Pichai ha fornito numeri che servono esattamente a questo racconto industriale. L’app Gemini ha superato i 900 milioni di utenti attivi mensili, contro i 400 milioni dell’anno precedente. Lo stesso Pichai ha dichiarato che AI Overviews ha oltre 2,5 miliardi di utenti mensili e che AI Mode ha già superato un miliardo di utilizzi mensili in un anno.
Sono dati aziendali, ma spiegano perché Google continui a distribuire i nuovi modelli prima di tutto dentro Search e Gemini: nessun concorrente ha la stessa scala di distribuzione immediata.
Dall’assistente all’agente: la scommessa Spark
La novità più importante, oltre al modello, è il cambio di paradigma. Google ha mostrato Gemini Spark, un agente personale costruito su 3.5 Flash, pensato per operare 24 ore su 24 nel cloud, sotto la supervisione dell’utente.
Secondo la copertura di The Verge e del Financial Times, Spark può aiutare a gestire email, studio, spese, pianificazione e compiti continuativi, con integrazione progressiva nei servizi Google e in piattaforme terze tramite protocolli come mcp. Google lo sta distribuendo ai trusted tester e prevede una beta per gli abbonati Google AI Ultra negli Stati Uniti.
Se gli utenti delegano compiti, non solo richieste singole, Google aumenta il tempo di permanenza nel proprio ecosistema, la profondità dei dati contestuali che può usare con consenso e i punti in cui può monetizzare servizi premium.
È la stessa logica che porta l’azienda a spingere su Antigravity, la piattaforma di sviluppo agentico destinata agli sviluppatori. Un agente che scrive codice o monitora dati in modo continuativo vale di più, in termini di ricavo potenziale, di un semplice completamento testuale.
La concorrenza non guarda ai benchmark, guarda ai ricavi
L’annuncio di Gemini 3.5 Flash arriva in una fase in cui il settore sta misurando sempre meno il successo in base alle sole classifiche e sempre più in base all’adozione.
OpenAI presidia l’uso consumer e business con ChatGPT e i suoi strumenti per workflow.
Anthropic si è costruita una reputazione forte tra sviluppatori e imprese, soprattutto sul coding e sui casi d’uso sicuri e controllabili. Google parte da una base enorme di utenti e infrastrutture, ma secondo il Financial Times vuole ancora recuperare terreno proprio nel coding professionale e nell’automazione aziendale, aree in cui OpenAI e Anthropic hanno consolidato una presenza forte.
Per questo 3.5 Flash viene presentato come modello “per agenti e coding” prima ancora che come modello generalista.
Nella pagina DeepMind la gerarchia dei benchmark è rivelatrice: coding, workflow con mcp, uso di strumenti, controllo dell’interfaccia, compiti finanziari, comprensione multimodale. È una sequenza che corrisponde quasi perfettamente ai segmenti in cui si decide la spesa enterprise.
Prezzi, distribuzione e scala: il vantaggio che Google prova a usare
Un altro punto spesso sottovalutato è la distribuzione. 3.5 Flash è disponibile nell’app Gemini, in AI Mode su Search, in Google Antigravity, nella Gemini API, in Android Studio e nelle offerte enterprise. Anche se la documentazione prezzi della Gemini API disponibile oggi non mostra ancora in modo completo e stabile tutti i dettagli commerciali per 3.5 Flash, Google ha già usato in passato la famiglia Flash come leva di accesso rapido e a costo più basso rispetto ai modelli Pro. Questa coerenza di posizionamento conta: permette di portare lo stesso modello in consumo, sviluppo e impresa.

È anche una risposta a un problema strutturale del mercato AI. I modelli più avanzati costano molto in inferenza e non sempre hanno una redditività chiara. Un modello più veloce, con output sufficiente per attività produttive ripetitive, può essere più importante del modello più sofisticato in assoluto.
Da questo punto di vista Google sembra voler occupare il segmento dove il valore economico è più immediato: assistenza al coding, automazione documentale, agenti di ricerca e strumenti di produttività integrati in prodotti già diffusi.
I limiti: molta promessa, verifica ancora parziale
L’entusiasmo di Google va però separato dai fatti già verificabili. I benchmark pubblicati da DeepMind esistono e mostrano un salto rispetto ai modelli precedenti in diverse categorie. Esiste anche una rete di partner che segnala miglioramenti reali. Ma molte promesse più ambiziose riguardano scenari d’uso ancora in rollout o in beta: Spark per pochi tester, 3.5 Pro rinviato al mese successivo, agenti in Search ancora da misurare su larga scala, impatto economico effettivo che dipenderà dalla capacità di far pagare questi strumenti senza comprimere margini.
Reuters fa notare che Google ha usato I/O 2026 anche per rivendicare una traiettoria di ritorno offensiva nel mercato ai, dopo gli anni in cui inseguiva. La tenuta di questa strategia si vedrà sui ricavi software e cloud, non solo sulla qualità delle demo.
Perché questa mossa conta per il mercato
L’annuncio di Google del 19 maggio 2026 vale più del singolo prodotto. Dice che il mercato dei modelli linguistici sta entrando in una fase diversa.
Primo: conta l’agente più del chatbot.
Secondo: conta la distribuzione più del laboratorio.
Terzo: conta il costo per compito completato più del fascino del benchmark isolato.
Google prova a usare insieme tutte e tre queste leve: modello veloce, rete di prodotti enorme, narrazione centrata sull’utilità economica.
Per Alphabet è una scommessa che tocca il cuore del conto economico: proteggere Search dalla disintermediazione conversazionale, vendere nuovi servizi enterprise ad alto margine, tenere gli sviluppatori nel proprio stack e trasformare Gemini da assistente opzionale a livello operativo dentro l’ecosistema Google.
Se la promessa reggerà, 3.5 Flash sarà ricordato come il modello con cui Google ha smesso di inseguire il mercato dell’AI generativa e ha iniziato a ridisegnarlo intorno ai propri punti di forza. Se invece la produttività promessa non si tradurrà in ricavi e retention, resterà un altro passaggio di una corsa molto costosa, dove la velocità da sola non basta.




