AI GENERATIVA

I benchmark sugli agenti di intelligenza artificiale sono fuorvianti

Un recente studio condotto dai ricercatori dell’Università di Princeton ha rivelato diverse carenze nelle pratiche di valutazione degli agenti, che ne ostacolano l’utilità nelle applicazioni reali. Non è possibile valutarli nello stesso modo in cui si valutano i modelli di fondazione

Pubblicato il 9 lug 2024

Aggiungi tra i preferiti su Google

Pierluigi Sandonnini

Gli agenti di intelligenza artificiale stanno diventando una nuova promettente direzione di ricerca con potenziali applicazioni nel mondo reale. Questi agenti utilizzano modelli di base come i modelli linguistici di grandi dimensioni (LLM) e i modelli linguistici di visione (VLM) per prendere istruzioni in linguaggio naturale e perseguire obiettivi complessi in modo autonomo o semi-autonomo. Gli agenti di intelligenza artificiale possono utilizzare vari strumenti come browser, motori di ricerca e compilatori di codice per verificare le loro azioni e ragionare sui loro obiettivi.

@RIPRODUZIONE RISERVATA

Pierluigi Sandonnini

Senior web editor di Nextwork360. Oltre trent’anni di esperienza giornalistica, maturata in diversi settori della tecnologia: audio video, tv digitale, telecomunicazioni, internet, intelligenza artificiale.

Dal 2020 gestisce il sito Ai4business.it, coordinando la redazione, curandone i contenuti e scrivendo articoli.

Seguimi su

Continua a leggere questo articolo

Argomenti

Canali

I benchmark sugli agenti di intelligenza artificiale sono fuorvianti

Pierluigi Sandonnini

Continua a leggere questo articolo

Articoli correlati

Codice Rss

Codice Rss