Non è facile essere uno dei benchmark preferiti della Silicon Valley.
ANALISI
AI benchmark in crisi: ecco come migliorare i test
Per migliorare i metodi con cui testiamo e valutiamo i modelli di intelligenza artificiale, il settore guarda alle scienze sociali. Con benchmark sempre più manipolabili e metriche poco affidabili, un nuovo approccio basato sulla validità potrebbe rivoluzionare la misurazione delle reali capacità dei modelli AI

Continua a leggere questo articolo
Argomenti
Canali