Seby Costantino

Gen-(AI) Specialist

Marketing Manager

AI Content Creator

Consulente IA

Formatore IA

Seby Costantino

Gen-(AI) Specialist

Marketing Manager

AI Content Creator

Consulente IA

Formatore IA

Blog Post

Le novità più importanti di Google I/O 2026

Le novità più importanti di Google I/O 2026

Al keynote dello Shoreline Amphitheatre, Sundar Pichai ha presentato non una lista di funzioni, ma un cambio di paradigma: l’AI di Google smette di rispondere e inizia ad agire.

Sundar Pichai sul palco dello Shoreline Amphitheatre, Mountain View, 19 Maggio 2026.

C’è un momento, in ogni ciclo tecnologico, in cui le demo smettono di essere promesse e diventano prodotti. Il keynote di Google I/O 2026 ha avuto il merito di sembrare esattamente quel momento. Non perché Google abbia presentato tecnologie mai viste, molte erano già nell’aria da settimane, ma perché per la prima volta l’intelligenza artificiale di Mountain View si è mostrata come un ecosistema coerente, capace di operare in modo autonomo per conto degli utenti.

I numeri con cui Pichai ha aperto il palco raccontano la scala del fenomeno: Google elabora oggi oltre 3,2 quadrilioni di token al mese, sette volte più rispetto all’anno scorso. L’app Gemini ha superato i 900 milioni di utenti attivi mensili, più che raddoppiata in dodici mesi. AI Overviews nella Ricerca raggiunge 2,5 miliardi di persone. Ma la vera notizia non è quantitativa: è che Google non vuole più soltanto risponderti. Vuole lavorare per te.


Gemini 3.5 Flash: il modello che cambia l’economia dell’AI

Non tutti i lanci di modelli sono uguali. Alcuni fanno notizia per le prestazioni grezze; altri ridisegnano le regole del gioco sul piano economico. Gemini 3.5 Flash appartiene senza dubbio alla seconda categoria. Supera Gemini 3.1 Pro in quasi tutti i benchmark standard, eppure costa meno della metà rispetto ai modelli concorrenti di pari livello.

Il dato più sorprendente riguarda la velocità: è quattro volte più veloce degli altri modelli frontier in termini di token di output al secondo. Google ha poi ottimizzato ulteriormente la versione integrata nella piattaforma Antigravity, arrivando a un vantaggio di dodici volte rispetto ai concorrenti di fascia alta. Per chi sviluppa applicazioni su larga scala, questa combinazione di costo e velocità è straordinaria.

Il grafico presentato sul palco: Gemini 3.5 Flash si posiziona da solo nel quadrante intelligenza alta / velocità alta.

Pichai ha tradotto il vantaggio economico in cifre concrete: le principali aziende elaborano circa un trilione di token al giorno. Spostando l’80% del carico su Gemini 3.5 Flash, risparmiano oltre un miliardo di dollari all’anno. “Molte aziende hanno già esaurito i loro budget annuali per i token, e siamo solo a maggio”, ha detto Pichai sul palco, con una punta di ironia.

Il modello è disponibile da oggi in tutti i prodotti Google, in Google AI Studio e su Vertex AI. La versione Gemini 3.5 Pro, già in testing interno con ottimi risultati, è attesa il mese prossimo.


Gemini Omni Flash: quando il video diventa conversazione

Tutti si aspettavano Veo 4. Google ha presentato qualcosa di diverso e più ambizioso. Gemini Omni Flash è il primo modello della famiglia Omni, progettato per generare output in qualsiasi modalità, video, immagini, testo, a partire da qualsiasi tipo di input. La differenza con un modello video tradizionale non è estetica: Omni fonde l’intelligenza di ragionamento di Gemini con le capacità generative di Veo e Lyria in un’unica architettura nativa.

Il risultato pratico è un editing video conversazionale senza precedenti. Carichi un video, scrivi in linguaggio naturale quello che vuoi cambiare, e Omni interviene: modifica ambienti, aggiunge oggetti, sostituisce personaggi, cambia illuminazione, applica stili visivi diversi. Il tutto preservando la performance originale degli attori e la coerenza visiva tra i frame. Nelle demo sul palco hanno generato sedici varianti video diverse partendo da una singola fotografia.

Gemini Omni Flash: il primo modello multimodale nativo di Google, disponibile da oggi.

Il modello mantiene identità e voce dei personaggi attraverso scene diverse, e il lip-sync in lingue diverse dall’inglese, incluso l’italiano, è stato mostrato come praticamente perfetto. Gemini Omni Flash è disponibile da oggi sull’app Gemini, su Google Flow e su YouTube Shorts. Le API per sviluppatori arriveranno nelle prossime settimane.

Omni arriva anche su Google Flow Music

La stessa tecnologia entra in Google Flow Music: gli artisti possono creare music video conversazionalmente, descrivendo scene, stili e soggetti, e Omni genera il video in sincronia con la musica. Su Flow Music arrivano anche controlli più granulari per l’editing: è possibile selezionare qualsiasi sezione di un brano e riscriverne i testi, cambiarne lo stile, tradurla in un’altra lingua, tutto senza alterare il resto della canzone. La funzione “Covers” trasforma lo stile di un’intera canzone mantenendone melodia e struttura originale.


Google Flow Tools: la creatività su misura, senza saper programmare

Google Flow si evolve da studio di generazione video a piattaforma creativa completa. L’aggiornamento centrale sono i Tools: un sistema che permette di costruire flussi di lavoro creativi personalizzati all’interno di Flow descrivendo in linguaggio naturale quello che si vuole ottenere. Nessuna riga di codice necessaria.

Si possono creare editor di immagini con effetti specifici, ridimensionatori video, applicatori di shader personalizzati, qualsiasi strumento visivo. Una volta creato, un Tool può essere condiviso con altri utenti della piattaforma o remixato a partire da quelli già esistenti nella galleria integrata.

Google Flow: l’aggiornamento più completo dalla nascita della piattaforma.

Google ha collaborato con creativi di diversi settori per sviluppare i primi Tool disponibili: László Gaal ha creato “pixelBento” per effetti lo-fi e glitch aesthetic; Kat Zhang e MetaPuppet hanno sviluppato strumenti per filmmaker e VJ. Tutti gli utenti Flow possono usare i Tool esistenti; gli abbonati Google AI possono anche crearne di nuovi.

Arriva anche il Flow Agent, disponibile gratuitamente per tutti: un assistente integrato nella piattaforma che aiuta nel brainstorming, nell’editing, nella generazione di varianti multiple degli asset e nella loro organizzazione automatica in collezioni. Sia Flow che Flow Music lanciano inoltre le prime applicazioni mobile: Flow è in beta su Android, Flow Music è già disponibile su iOS.


Gemini Spark: il tuo agente personale non dorme mai

Questa è probabilmente la novità con l’impatto più diretto sulla vita dell’utente finale. Gemini Spark è il primo agente AI personale di Google che funziona davvero in autonomia, senza che l’utente debba stare davanti allo schermo.

Gira su macchine virtuali dedicate su Google Cloud, attive 24 ore su 24. Non è necessario lasciare il computer acceso né tenere aperta un’app. Spark pianifica task multi-step, li esegue in background e contatta l’utente solo quando ha bisogno di una decisione o approvazione. Si integra nativamente con Gmail, Calendar, Docs, Sheets e Tasks, e supporta già il protocollo MCP per l’integrazione con applicazioni di terze parti.

“Non si tratta di un assistente che risponde. Si tratta di un agente che agisce.”

La nuova interfaccia dell’app Gemini con Spark e Daily Brief.

Nella demo più convincente del keynote, Spark ha organizzato un intero evento da solo: ha inviato inviti, tracciato le risposte su Sheets, creato presentazioni in Slides, gestito i follow-up, tutto senza intervento umano. In estate opererà anche direttamente in Chrome come browser-agente, navigando il web e completando azioni per conto dell’utente. Su Android, un nuovo spazio dell’interfaccia chiamato Android Halo permetterà di monitorare i progressi degli agenti in tempo reale.

Spark è disponibile dalla prossima settimana in beta per gli abbonati Google AI Ultra, il cui piano è sceso da 250 a 200 dollari al mese.

Daily Brief: il riassunto mattutino che capisce le priorità

Sempre nell’app Gemini arriva Daily Brief, un agente che ogni mattina sintetizza Gmail, Calendar e Tasks per presentare le cose più importanti della giornata. Non si limita a riassumere: stabilisce priorità, organizza le informazioni e suggerisce i passi successivi, in un formato conciso pensato per una lettura rapida.


Antigravity 2.0: la piattaforma degli sviluppatori diventa desktop

Google ha trasformato Antigravity da strumento interno a applicazione desktop standalone per chiunque voglia costruire con l’AI. Antigravity 2.0 non è un semplice ambiente di sviluppo: è una piattaforma completa per orchestrare flussi multi-agente, generare asset e costruire applicazioni. Nella demo più spettacolare del keynote, il team ha fatto girare Doom su un sistema operativo generato interamente al volo da Antigravity.

La piattaforma gira sulla versione di Gemini 3.5 Flash ottimizzata per gli agenti, quella dodici volte più veloce dei concorrenti. Internamente Google elabora già oltre tre trilioni di token al giorno con questi strumenti, una cifra che raddoppia ogni poche settimane da marzo. Antigravity 2.0 è disponibile globalmente da oggi.


Google Search agentica: la ricerca non risponde più, anticipa

Pichai ha definito questo il più importante aggiornamento della Ricerca degli ultimi 25 anni. La barra di ricerca si espande dinamicamente per accogliere domande articolate, accetta input multipli (testo, immagini, file, video, schede Chrome aperte), e introduce gli Information Agents: sistemi persistenti che lavorano in background 24 ore su 24, monitorando il web e inviando notifiche quando rilevano qualcosa di rilevante.

La nuova Google Search: interfacce generative, agenti informativi e Universal Cart.

Gli scenari d’uso sono concreti: chi cerca casa riceve una notifica quando appare un annuncio corrispondente ai propri criteri; chi segue un brand viene avvisato al lancio di un nuovo prodotto. Gli Information Agents saranno disponibili in estate per gli abbonati Google AI Pro e Ultra.

Sul fronte shopping debutta Universal Cart, un carrello intelligente che funziona attraverso Search, Gemini, YouTube e Gmail, tracciando offerte e cali di prezzo. Alla base c’è l’Universal Commerce Protocol, uno standard open-source con Amazon tra i primi partner. Per alcune categorie, come riparazioni domestiche e servizi alla persona, Google potrà addirittura telefonare alle attività per prenotare appuntamenti direttamente.

Debutta anche Ask YouTube: si fanno domande in linguaggio naturale e il sistema non solo trova il video più pertinente, ma porta direttamente al punto esatto dove si trova la risposta. In test ora, rollout negli USA in estate.


AI Glasses: Gemini sempre nell’orecchio, con o senza iPhone

Google ci riprova con gli occhiali smart, ma questa volta con una strategia più prudente. Non punta subito sulla realtà aumentata con display olografico: lancia prima le Audio Glasses, occhiali senza display che portano Gemini direttamente nell’orecchio dell’utente tramite accesso vocale.

Le Audio Glasses: accesso vocale a Gemini con mani libere e occhi liberi, compatibili con Android e iPhone.

Si indossano tutto il giorno, si connettono allo smartphone e permettono di interagire con Gemini ricevendo risposte in auricolare in modo discreto. Il dettaglio forse più strategico: funzionano sia con Android che con iPhone, un segnale chiaro di voler raggiungere la massima base utenti possibile. Prodotte da Samsung in collaborazione con Gentle Monster e Warby Parker, arrivano in autunno 2026. In parallelo, Google ha mostrato Project Aura, occhiali AR con display a comparsa per informazioni contestuali, previsti entro fine anno.


SynthID diventa standard di settore

Tre anni dopo il lancio, SynthID compie un salto di scala e di significato. Il sistema di watermarking invisibile di Google ha già contrassegnato oltre 100 miliardi di immagini e video e 60.000 anni di contenuti audio. Ma la notizia vera è quella sui partner.

Fino ad oggi SynthID era uno strumento interno di Google e di pochi partner. Da oggi, OpenAI, ElevenLabs e Kakao adottano SynthID per watermarkare i propri contenuti generati dall’AI. Si aggiungono a Nvidia, già aderita lo scorso anno. Il risultato è che SynthID inizia a configurarsi come uno standard de facto per l’autenticazione dei contenuti AI su scala industriale.

Sul lato utente, le credenziali C2PA arrivano su Chrome e Gemini: con un semplice click destro su qualsiasi immagine sarà possibile sapere se è generata da un’AI, scattata da una fotocamera, o modificata con strumenti di AI generativa.


Le altre novità da non perdere

Google Pics è il nuovo strumento di creazione e modifica immagini basato su Nano Banana. La caratteristica distintiva è che tratta ogni elemento come un oggetto individuale: puoi modificare dettagli specifici con grande precisione, senza alterare il resto dell’immagine. Disponibile in estate per gli abbonati Google AI Pro e Ultra.

Docs Live trasforma la creazione di documenti: invece di scrivere un prompt, puoi parlare liberamente e Gemini trascrive, struttura e formatta il documento in automatico. Arriverà estesa anche a Gmail e Google Keep in estate.

Gemini for Science mette l’AI al servizio della ricerca scientifica, connettendo la piattaforma Antigravity a oltre trenta tra i principali database di scienze biologiche. Disponibile già oggi su GitHub e direttamente in Antigravity.

Sul fronte infrastruttura, Google ha presentato le nuove TPU 8t e 8i, chip di ottava generazione specializzati rispettivamente per training e inferenza. Le 8t permettono di distribuire l’addestramento su oltre un milione di TPU a livello globale; le 8i minimizzano la latenza in produzione. Entrambe offrono prestazioni per watt fino a due volte superiori alla generazione precedente.

Le nuove TPU 8t e 8i: il silicio proprietario di Google che alimenta l’era degli agenti.


Cosa significa tutto questo

Google I/O 2026 ha segnato un punto di svolta reale, non comunicativo. Per la prima volta, la visione di un’AI che lavora in modo autonomo per conto dell’utente è uscita dalla fase di promessa e si è concretizzata in prodotti disponibili oggi o nelle prossime settimane.

Il filo che collega tutti gli annunci è la proattività: Gemini Spark pianifica ed esegue in cloud, gli Information Agents monitorano il web, Omni Flash trasforma qualsiasi input in output creativo su richiesta. Google sta costruendo un layer di agenti AI che si sovrappone all’intera vita digitale dell’utente, dai documenti alla musica, dalla ricerca agli acquisti.

Con la WWDC 2026 di Apple fissata per l’8 giugno e OpenAI in costante accelerazione, la partita è apertissima. Ma Google gioca con un vantaggio strutturale difficile da replicare: miliardi di utenti già dentro i suoi prodotti, chip proprietari, e un ecosistema che va da Search a YouTube, da Chrome a Gmail. La domanda non è più chi ha il modello migliore. È chi costruisce l’agente più utile nella vita quotidiana delle persone.

Fonti

  1. Melamorsicata.it — “Google I/O 2026: la svolta agentica”
    https://www.melamorsicata.it/2026/05/19/google-io-2026-svolta-agentica-gemini/
  2. Google Blog — “I/O 2026: Benvenuti nell’era degli agenti Gemini” (Sundar Pichai)
    https://blog.google/intl/it-it/intlit-itnotizie-aziendalitecnologiasundar-pichai-io-2026/
  3. Google Blog — “New agents, mobile apps and Gemini Omni for Google Flow and Google Flow Music”
    https://blog.google/innovation-and-ai/models-and-research/google-labs/flow-updates/
  4. Tecnoandroid.it — “Google I/O 2026: Google Ricerca cambia, dagli agenti alla nuova barra intelligente”
    https://www.tecnoandroid.it/2026/05/19/…
  5. Punto-Informatico.it — “Google I/O 2026 inizia oggi alle 19 ora italiana”
    https://www.punto-informatico.it/…
  6. Google I/O 2026 About page — https://io.google/2026/about