No Language Left Behind: Meta annuncia il suo traduttore open source in 200 lingue

Per alcune lingue africane e indiane questo modello migliora i sistemi di traduzione esistenti di oltre il 70% e raggiunge anche un aumento medio del 44% dei punteggi complessivi di valutazione bilingue understudy (BLEU)

Pubblicato il 19 Lug 2022

NLLB Meta

Meta ha annunciato di recente una svolta nella ricerca nel suo progetto “No Language Left Behind” (NLLB) progettato per sviluppare le capacità di traduzione automatica di alta qualità per la maggior parte delle lingue del mondo.

“Abbiamo appena lanciato un modello di intelligenza artificiale in grado di tradurre in 200 lingue diverse, molte delle quali non sono supportate dagli attuali sistemi di traduzione”, ha dichiarato Mark Zuckerberg, fondatore e CEO di Meta.

La competizione con i rivali Google Translate e Microsoft Bing Translator

Con una popolazione digitale mondiale di oltre 5 miliardi di persone che parlano 7.151 lingue, non c’è da meravigliarsi che i moderni sistemi di traduzione siano molto richiesti. Tuttavia, la scarsità di dati linguistici limita la portata delle tecnologie di traduzione che tentano di superare le barriere linguistiche nel consumo di contenuti digitali. Nonostante la sofisticazione dell’offerta di traduzione automatica neurale multilingue di Google, Google Translate, le sue capacità di traduzione sono limitate a 133 lingue.

Microsoft Bing Translator, un altro strumento di traduzione di una delle più grandi aziende tecnologiche del mondo, copre poco più di 100 lingue. Considerando che più della metà della popolazione mondiale parla solo 23 delle 7.151 lingue del mondo che sono molto comuni su Internet, molte lingue (specialmente in Africa e in Asia) non sono supportate in questi sistemi. Ciò indica un flusso interattivo stentato tra i parlanti di queste lingue e il contenuto che desiderano consumare.

AI e traduzione in azienda

Tra i molti modi in cui l’intelligenza artificiale (AI) sta ridefinendo l’interazione e l’efficienza umana, la traduzione è uno dei più eccitanti. La traduzione automatica, la manifestazione dell’AI nella traduzione, è un mercato valutato a 800 milioni di dollari a partire dal 2021, con un valore previsto di 7,5 miliardi di dollari entro il 2030.

Global Market Insights ha rivelato che la crescente necessità per le aziende di migliorare l’esperienza del cliente è uno dei principali driver della crescita del settore della traduzione automatica. Ciò è confermato dalla ricerca di Gartner, che rivela che la traduzione è una preoccupazione aziendale diffusa, soprattutto perché diventa sempre più rilevante in quattro principali casi d’uso sincroni e asincroni: multimedia (ad esempio, formazione e seminari), vendite e supporto online dei clienti (ad esempio, query e chatbot), multimedia in tempo reale (riunioni, ecc.) e documenti, testi e segmenti (ad esempio, blog e informazioni sui prodotti).

Pertanto, le aziende che sperano di ottenere una portata più globale richiedono soluzioni di traduzione inclusive che soddisfino le esigenze sempre più complesse di una base di consumatori globale. È qui che entra in gioco il progetto di Meta.

NLLB di Meta: una svolta nella traduzione automatica di qualità

Il progetto NLLB, lanciato oltre sei mesi fa, è l’ambizioso tentativo di Meta di costruire un traduttore linguistico universale in grado di elaborare ogni lingua indipendentemente dai dati linguistici disponibili per l’AI. Oggi, Meta ha annunciato una svolta in questo progetto chiamato NLLB-200 – un singolo modello di intelligenza artificiale che traduce oltre 200 lingue diverse con risultati all’avanguardia.

Questo modello supporta la traduzione di alta qualità di lingue meno diffuse, in particolare dall’Asia e dall’Africa. Ad esempio, il modello supporta la traduzione di 55 lingue africane a basso contenuto di risorse, con un aumento del 46% rispetto a quanto ottenibile con gli strumenti di traduzione esistenti.

Meta afferma che per alcune lingue africane e indiane questo modello migliora i sistemi di traduzione esistenti di oltre il 70% e raggiunge anche un aumento medio del 44% dei punteggi complessivi di valutazione bilingue understudy (BLEU) attraverso le 10mila direzioni del benchmark FLORES-101.

Per dare un’idea della scala, Zuckerberg rivela che “il modello in 200 lingue ha oltre 50 miliardi di parametri, [addestrati] utilizzando il nuovo Research SuperCluster (RSC) di [Meta], che è uno dei supercomputer AI più veloci al mondo. I progressi qui consentiranno più di 25 miliardi di traduzioni ogni giorno attraverso le nostre app”.

Nonostante questa svolta, Meta si rende conto che raggiungere gli obiettivi del progetto NLLB sarà impossibile senza una collaborazione innovativa. Per consentire ad altri ricercatori di espandere la portata del linguaggio e costruire tecnologie più inclusive, ha reso il modello NLLB-200 open source e ha anche fornito sovvenzioni fino a 200mila dollari a organizzazioni senza scopo di lucro per applicare l’NLLB-200 alle loro operazioni.

Anche Wikipedia sfrutterà questa tecnologia per tradurre i propri articoli multimediali in oltre 20 lingue a basso contenuto di risorse.

Qui una demo del traduttore automatico di Meta.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati

Articolo 1 di 3