ANALISI

AI benchmark in crisi: ecco come migliorare i test



Indirizzo copiato

Per migliorare i metodi con cui testiamo e valutiamo i modelli di intelligenza artificiale, il settore guarda alle scienze sociali. Con benchmark sempre più manipolabili e metriche poco affidabili, un nuovo approccio basato sulla validità potrebbe rivoluzionare la misurazione delle reali capacità dei modelli AI

Pubblicato il 9 mag 2025



benchmark

Non è facile essere uno dei benchmark preferiti della Silicon Valley.

Continua a leggere questo articolo

Articoli correlati