News

Google fa progressi nel text-to-video e nella traduzione linguistica

Le novità interessano l'AI generativa, la traduzione linguistica, l'AI per la sanità e la gestione dei disastri. L'evento si è concentrato molto sulla discussione sugli sforzi per costruire un'AI responsabile [...]
google
Sundar Pichai in videoconferenza all'evento Google AI
  1. Home
  2. News
  3. Google fa progressi nel text-to-video e nella traduzione linguistica

In occasione dell’ evento Google AI del 2 novembre 2022, Google ha annunciato una serie di progressi dell’intelligenza artificiale, tra cui l’AI generativa, la traduzione linguistica, l’AI per la sanità e la gestione dei disastri. L’evento si è anche concentrato molto su una discussione sugli sforzi per costruire un’AI responsabile, in particolare relativamente al controllo e alla sicurezza, aiutando a identificare l’AI generativa.

“Vediamo così tante opportunità davanti a noi e ci impegniamo a garantire che la tecnologia sia costruita per aiutare le persone, come qualsiasi tecnologia di trasformazione”, ha detto il CEO di Google, Sundar Pichai, in un video condiviso con i partecipanti. L’evento aveva lo scopo di “reimmaginare come la tecnologia può essere utile nella vita delle persone”.

Pichai ha sottolineato i rischi e le sfide che derivano dall’AI. “Ecco perché Google si è concentrata sull’AI responsabile fin dall’inizio, pubblicando principi di intelligenza artificiale che danno priorità alla sicurezza e alla privacy delle persone rispetto a qualsiasi altra cosa”, ha affermato.

Google: debutta Imagen Video – Phenaki combo

Douglas Eck, scienziato principale di Google Research e direttore della ricerca per il Brain Team di Google, ha condiviso una serie di annunci di intelligenza artificiale generativa di Google, inclusi gli sforzi per rilasciare sistemi di intelligenza artificiale text-to-image.

Mentre Google Imagen non è ancora disponibile al pubblico, la società ha annunciato che ne aggiungerà una forma limitata alla sua app AI Test Kitchen (che quest’anno ha mostrato LaMDA) come un modo per raccogliere feedback precoci. La società ha mostrato una demo chiamata City Dreamer in cui gli utenti possono generare immagini di una città progettata attorno a un tema, come, ad esempio, le zucche.

Inoltre, basandosi sul lavoro text-to-video annunciato il mese scorso, Google ha condiviso il primo rendering di un video che condivide entrambi gli approcci di ricerca text-to-video complementari dell’azienda: Imagen Video e Phenaki. Il risultato combina la capacità di Phenaki di generare video con una sequenza di istruzioni di testo con i dettagli ad alta risoluzione di Imagen.

Google

Altri progressi di Google nell’AI generativa

Eck ha anche discusso del motore di dialogo LaMDA e del Wordcraft Writers Workshop, che ha sfidato gli autori professionisti a scrivere narrativa sperimentale usando LaMDA come strumento.

Google rilascerà presto un documento di ricerca su questo, ha detto Eck.

WHITEPAPER
AZIENDA RETAIL: ecco i 15 motivi per cui hai bisogno dell'Intelligenza Artificiale!
Intelligenza Artificiale
Retail

“Abbiamo scoperto che usare LaMDA per scrivere storie complete è un vicolo cieco”, ha detto. Anche l’interfaccia utente deve essere corretta, ha aggiunto, fungendo da “editor di testo con uno scopo”.

Eck ha anche sottolineato gli sforzi di Google per utilizzare l’intelligenza artificiale per generare codice, così come la ricerca recentemente introdotta da AudioLM che, senza bisogno di uno spartito musicale, estende l’audio da qualsiasi clip audio inserita – e DreamFusion, il rendering text-to-3D recentemente annunciato che combina Imagen con le funzionalità 3D di NeRF.

“Non ho mai visto così tanti progressi nello spazio generativo, il ritmo è davvero incredibile”, ha detto Eck.

Google sta realizzando un traduttore vocale universale

Dopo aver esaminato una serie di progressi di Google nella ricerca sull’intelligenza artificiale linguistica, il leader di Google Brain, Zoubin Ghahramani ha annunciato lo sforzo dell’azienda per riflettere la diversità delle lingue del mondo e un ambizioso tentativo di costruire un modello che supporti le prime 1000 lingue del mondo.

Inoltre, Google sta costruendo un modello vocale universale addestrato su oltre 400 lingue, con l’affermazione che è la “più grande copertura di modelli linguistici vista oggi in un modello vocale”.

Forte attenzione all’AI responsabile

Marian Croak, VP of engineering di Google, e James Manyika, SVP di Google-Alphabet, hanno discusso dell’attenzione di Google sull’AI responsabile. “Penso che se vogliamo essere leader, è estremamente importante spingere lo stato dell’arte sulla tecnologia AI responsabile”, ha affermato Croak.

Google fa test contraddittori “costantemente e continuamente”, ha detto Croak. “Quindi ci assicuriamo anche di stabilire parametri di riferimento quantitativi e che possano essere misurati e verificati in tutte le dimensioni della nostra AI. Quindi, lo facciamo anche su base continuativa”.

 

FacebookTwitterLinkedIn
FacebookTwitterLinkedIn