NEWS

Meta svela Llama 2 Long



Indirizzo copiato

Pubblicato, quasi in sordina, un articolo che descrive il nuovo modello open source. Nella comparazione è in grado di battere, su alcuni compiti, sia GPT-3.5 Turbo sia Claude 2

Pubblicato il 2 ott 2023




Llama2

Quasi in sordina, nonostante ne avesse avuto l’occasione durante l’evento Meta Connect, Meta Platforms ha pubblicato un articolo sito web non peer reviewed arXiv.org in cui presenta Llama 2 Long, un nuovo modello di intelligenza artificiale basato su Llama 2 open source di Meta, che è stato sottoposto a “un continuo preaddestramento da Llama 2 con sequenze di addestramento più lunghe e su un set di dati in cui i testi lunghi sono sovracampionati”, secondo i ricercatori-autori del documento “Effective Long-Context Scaling of Foundation Models” del 27 settembre 2023.

Continua a leggere questo articolo

Articoli correlati