B

benchmark


  • Google Gemini 3 prova
  • tecnologia

    Gemini 3 alla prova: cosa dicono veramente i test sul nuovo modello di Google

    26 Nov 2025

    di Giovanni Masi

    Condividi
  • OpenAI evals
  • tecnologia

    Come gli evals stanno guidando l'introduzione dell’AI nelle imprese

    20 Nov 2025

    di Alessandra Castelli

    Condividi
  • SWE-bench
  • approfondimento

    SWE-bench: cos’è la piattaforma che mette l’AI alla prova in ingegneria informatica

    30 Mag 2025

    di Gioele Fierro

    Condividi
  • benchmark
  • ANALISI

    AI benchmark in crisi: ecco come migliorare i test

    09 Mag 2025

    di Pierluigi Sandonnini

    Condividi
  • evoluzione agenti LLM
  • large language model

    Arriva Chatbot Arena Italia, la prima piattaforma di comparazione degli LLM per la lingua italiana

    25 Feb 2025

    di Redazione

    Condividi
Pagina 1 di 1
  • Archivio Newsletter

  • Newsletter
    Iscriviti alla newsletter di AI4Business

    Vuoi ricevere le news più importanti, gli approfondimenti e le interviste di AI4Business?

    Cliccando su "ISCRIVITI ALLA NEWSLETTER", dichiaro di aver letto l' Informativa Privacy e di voler ricevere la Newsletter.
  • Segui gli ultimi update

    Entra nella community

  • Contattaci

    Vuoi maggiori informazioni?

  • redazione@ai4business.it