ai generativa

Sora 2: l’evoluzione del video (e audio) AI generated



Indirizzo copiato

Il nuovo modello di OpenAI segna un salto tecnologico per il video e l’audio generati dall’intelligenza artificiale. Più realistico, fisicamente accurato e controllabile rispetto alle versioni precedenti, introduce funzioni social innovative come i “camei” e un’app dedicata. Una svolta che potrebbe ridisegnare creatività, intrattenimento e simulazioni del mondo reale. Disponibile, per ora, in Usa e Canada

Pubblicato il 1 ott 2025



Sora 2

Il primo modello Sora, lanciato nel febbraio 2024, aveva rappresentato per il video ciò che GPT-1 fu per il linguaggio: l’inizio di una rivoluzione. Con semplici comportamenti emergenti, come la permanenza degli oggetti, aveva dimostrato il potenziale dell’addestramento su larga scala. Sora 2 porta questa evoluzione più avanti, puntando a un realismo fisico e narrativo ineguagliati.

Sora 2, un modello che rispetta la fisica

La differenza più evidente è nella gestione della realtà. Se i modelli precedenti spesso “forzavano” gli eventi per soddisfare il prompt, deformando oggetti o tele-trasportando palloni nel canestro, Sora 2 introduce errori credibili. Se un giocatore sbaglia un tiro, il rimbalzo avviene in modo coerente con le leggi della fisica. È un passo cruciale verso sistemi che simulano il mondo con fedeltà.

Creatività senza limiti: dal pattinaggio artistico ai vichinghi

Gli esempi forniti mostrano la versatilità del modello: un pattinatore che esegue un triplo axel con un gatto sulla testa, ginnasti olimpici, battaglie medievali o scene anime. Oltre alla generazione video, Sora 2 produce dialoghi sincronizzati, effetti sonori e paesaggi sonori complessi, ampliando il confine tra cinema digitale e creazione amatoriale.

Controllo e personalizzazione

Sora 2 è in grado di seguire istruzioni articolate su più inquadrature, mantenendo la coerenza degli elementi. Gli utenti possono anche inserire se stessi, i propri amici o oggetti reali nelle scene generate, con resa accurata di aspetto e voce. Una funzione che avvicina il concetto di “avatar realistico” alle esperienze quotidiane.

L’app Sora: creatività e socialità

Per sfruttare queste capacità, OpenAI lancia una nuova app iOS, “Sora”. Gli utenti possono creare e remixare contenuti, esplorare un feed personalizzato e usare i “camei”: brevi registrazioni che permettono di comparire in qualsiasi scena generata dall’IA. L’obiettivo dichiarato non è massimizzare il tempo trascorso online, ma stimolare la creazione condivisa.

Sicurezza e benessere digitale

Consapevole dei rischi di dipendenza e isolamento, OpenAI introduce limiti e strumenti di controllo: feed personalizzabili tramite linguaggio naturale, sondaggi sul benessere, parental control e restrizioni specifiche per i minori. Inoltre, gli utenti mantengono il pieno controllo del proprio “cameo”, potendo revocare in ogni momento l’autorizzazione all’uso della propria immagine.

Modello di business e prospettive

Al momento, Sora 2 è gratuito con limiti generosi, ma OpenAI prevede in futuro un’opzione a pagamento per chi desidera generare contenuti extra. È disponibile negli Stati Uniti e in Canada, con piani di espansione internazionale, integrazione in ChatGPT Pro e una futura API.

Secondo OpenAI, il progresso rapido dei modelli video porterà alla nascita di simulatori generali del mondo e agenti robotici, con impatti profondi su società ed economia. Sora 2 non è solo un prodotto di intrattenimento, ma un passo intermedio verso sistemi che comprendono e riproducono le dinamiche del mondo reale.

Ecco la traduzione in italiano, mantenendo tono chiaro e scorrevole:


Sora feed philosophy

Ecco alcuni dei principi fondamentali che guidano la visione di Sora:


L’obiettivo del feed di Sora è semplice: aiutare le persone a scoprire ciò che è possibile fare e ispirarle a creare. Alla base di questa visione ci sono alcuni principi chiave.

Ottimizzare la creatività. Il sistema di ranking è progettato per favorire la creatività e la partecipazione attiva, invece dello scroll passivo. Secondo questa impostazione, è proprio questo approccio a rendere Sora piacevole da utilizzare.

Mettere gli utenti al comando. Il feed include un ranking personalizzabile: l’utente può dire all’algoritmo esattamente che cosa desidera vedere. I genitori, tramite i controlli parentali di ChatGPT, hanno inoltre la possibilità di disattivare la personalizzazione e lo scroll continuo per i loro figli adolescenti.

Dare priorità alla connessione. L’obiettivo è aiutare le persone a rafforzare i legami e a crearne di nuovi, soprattutto grazie ai Camei, esperienze giocose e sorprendenti. I contenuti collegati tra loro avranno priorità rispetto a quelli globali e non connessi.

Equilibrio tra sicurezza e libertà. Il feed è stato progettato per essere accessibile e sicuro. Guardrail solidi impediscono la creazione di contenuti pericolosi o dannosi fin dall’inizio, e i contenuti che violano le policy vengono bloccati proattivamente. Allo stesso tempo, viene lasciato spazio all’espressione, alla creatività e alla comunità. Poiché i sistemi di raccomandazione sono in continua evoluzione, i dettagli verranno adattati nel tempo, sempre nel rispetto di questi principi.


Sora 2, come funziona

Gli algoritmi di raccomandazione di Sora offrono suggerimenti personalizzati con l’obiettivo di ispirare e incoraggiare la creatività. Poiché ogni individuo ha interessi e gusti unici, il sistema è stato sviluppato per adattarsi a ciascun utente.

Per personalizzare il feed, vengono considerati diversi segnali, tra cui:

  • Attività su Sora: i post pubblicati, gli account seguiti, i contenuti apprezzati o commentati, i remix realizzati, oltre alla posizione generale del dispositivo (ad esempio la città), ricavata dall’indirizzo IP.
  • Dati di ChatGPT: la cronologia di ChatGPT può essere presa in considerazione, ma può essere disattivata nelle impostazioni di Sora.
  • Interazioni con i contenuti: visualizzazioni, like, commenti e remix.
  • Segnali sull’autore: numero di follower, altri post pubblicati, livello di interazione precedente.
  • Segnali di sicurezza: valutazione sull’appropriatezza o meno di un contenuto.

Questi dati permettono di prevedere quali contenuti possano essere di interesse per l’utente o stimolarne la creatività. I genitori possono inoltre gestire la personalizzazione e lo scroll continuo attraverso i controlli parentali integrati in ChatGPT.


Sicurezza ed espressione: un equilibrio complesso

Garantire che il feed rimanga sicuro e divertente significa mantenere un equilibrio delicato: proteggere gli utenti da contenuti dannosi senza limitare eccessivamente la libertà creativa.

La prima barriera si trova nella fase di creazione. Poiché ogni contenuto nasce all’interno di Sora, sono stati inseriti guardrail che impediscono in anticipo la generazione di contenuti pericolosi, come materiale sessuale, violenza realistica, propaganda estremista, incitamento all’odio, autolesionismo o disturbi alimentari.

Il feed è inoltre progettato per essere adatto anche agli adolescenti. Per questo vengono filtrati i contenuti potenzialmente dannosi o inappropriati per l’età, con particolare attenzione a:

  • autolesionismo esplicito;
  • violenza o sessualità;
  • comportamenti alimentari o di esercizio non salutari;
  • critiche sull’aspetto fisico, confronti e bullismo;
  • sfide pericolose facilmente imitabili dai minori;
  • linguaggio estremo o contenuti che glorificano odio, depressione o violenza;
  • promozione di droghe, sostanze dannose o attività vietate ai minori.

Tutti i contenuti vengono analizzati tramite strumenti automatici per verificarne la conformità alle Global Usage Policies, sistemi costantemente aggiornati per gestire nuovi rischi. Gli utenti hanno la possibilità di segnalare contenuti ritenuti non conformi.

A questo si aggiunge una revisione umana: il team monitora le segnalazioni degli utenti e supervisiona proattivamente l’attività del feed, per individuare ciò che gli strumenti automatici potrebbero non rilevare.


Creatività con limiti intelligenti

La sicurezza non si riduce a filtri severi. Restrizioni eccessive soffocherebbero la creatività, mentre troppa libertà minerebbe la fiducia. Per questo viene perseguito un equilibrio: barriere preventive nei punti più rischiosi, unite a un sistema reattivo di segnalazione e rimozione che lascia spazio alla sperimentazione, garantendo però rapidità d’intervento in caso di abusi.

Questa filosofia si ispira già ai risultati ottenuti con il modello di generazione di immagini ChatGPT 4o e viene ora applicata anche al feed di Sora.

OpenAI è consapevole che questo bilanciamento non sarà perfetto sin dall’inizio. Sistemi di raccomandazione e modelli di sicurezza sono entità dinamiche in continua evoluzione: il feedback degli utenti sarà essenziale per perfezionarli. L’azienda dichiara di voler migliorare il sistema nel tempo, imparando insieme alla propria comunità.




La filosofia del feed di Sora mostra chiaramente l’intenzione di OpenAI di distinguersi dalle logiche di engagement tipiche dei social network tradizionali, basate sul tempo speso in piattaforma. L’enfasi sulla creatività e sul controllo degli utenti è positiva, ma resta da verificare quanto queste promesse resisteranno alle pressioni economiche. Senza un modello di business chiaro e sostenibile, il rischio è che in futuro la piattaforma ceda alle stesse dinamiche di monetizzazione che oggi dichiara di voler superare.

Articoli correlati