guida

ChartNet: come interpretare i grafici con l’AI



Indirizzo copiato

I modelli linguistico‑visivi non sono ancora in grado di interpretare correttamente grafici e diagrammi. ChartNet è un dataset sviluppato dal MIT‑IBM Computing Research Lab che permette di fare training multimodale con oltre un milione di grafici sintetici generati e annotati. Questa risorsa può migliorare i modelli open

Pubblicato il 12 giu 2026

Gioele Fierro

CEO e Founder Promezio Engineering



ChartNet: come interpretare i grafici con l’AI
AI Questions Icon
Chiedi all'AI
Riassumi questo articolo
Approfondisci con altre fonti

Punti chiave

  • Automatizzare l’analisi dei grafici è cruciale per la Business Intelligence, ma i modelli linguistico‑visivi e gli LLM attuali falliscono per mancanza di dataset specialistici.
  • Il dataset ChartNet include oltre 1,5M di grafici sintetici e reali con codice di generazione, tabelle, riassunti e Q&A; copre 24 tipi di grafici e 6 librerie grazie al code augmentation.
  • Il fine‑tuning su ChartNet migliora modelli piccoli, superando LLM più grandi in estrazione dati e QA; è open-source e abilita automazioni BI pratiche (es. Granite Vision).
Riassunto generato con AI


Raccogliere e visualizzare dati, dai report finanziari ai cruscotti di produzione, è un attivitá diventata fondamentale per la competitivitá di un business. Tradurre i grafici in decisioni richiede la collaborazione di analisti specializzati, ma in molti contesti inizia a esservi l’urgenza di automatizzare questa fase sfruttando modelli di intelligenza artificiale.
L’uso di modelli linguistico‑visivi (VLM) capaci di ricevere in input un’immagine e restituire un’analisi verbale potrebbe ridurre i tempi e i costi di analisi. I grandi LLM tendono, però, a commettere errori quando devono combinare la percezione visiva con dati numerici e linguistici. Anche investendo in sistemi di frontiera, un’automazione AI-powered potrebbe fornire risposte incomplete o imprecise, perché il compito richiede un’integrazione tra dati di differente natura che i modelli attuali non padroneggiano.

Se l’AI non sa riconoscere un picco in un grafico di vendite o l’andamento stagionale in un diagramma a linee, l’automazione rischia di generare interpretazioni fuorvianti.

Business intelligence e dataset per il fine-tuning

La Business Intelligence (BI) indica l’insieme di processi, tecnologie e competenze utilizzati per raccogliere, aggregare e analizzare i dati con l’obiettivo di supportare decisioni informate. Il focus della BI è la raccolta e la presentazione chiara dei dati per agevolare i processi decisionali, permettendo alle organizzazioni di estrarre velocemente valore e informazioni dai dati raccolti.

L’intepretazione dei dati visivi su cui la BI opera è, al momento, un limite significativo per l’uso dell’intelligenza artificiale. La carenza di dataset specifici, adatti all’addestramento dei modelli linguistico‑visivi è uno dei principali ostacoli al miglioramento delle prestazioni sui grafici. Le grandi aziende possono colmare questo vuoto creando dataset interni, ma per le PMI si tratta di un investimento oneroso e non giustificato.

Esistono alcuni dataset, come FigureQA, PlotQA, ChartQA o TinyChart, ma contengono esempi che coprono solo alcune modalità di rappresentazione e su una scala molto limitata. Per un ambiente di business intelligence che aspira a interpretare automaticamente grafici complessi, queste lacune impediscono ai modelli di apprendere relazioni profonde e riducono l’accuratezza delle analisi.

Che cos’è ChartNet

ChartNet è la risposta elaborata dai ricercatori dell’ MIT‑IBM Computing Research Lab alla carenza di dati di addestramento specializzati nell’interpretazione di dati rappresentati graficamente. Il dataset raccoglie più di 1,5 milioni di grafici sintetici e reali progettati per insegnare ai modelli a comprendere e ragionare sui grafici.

Ogni elemento di ChartNet contiene il codice di generazione del grafico, l’immagine del grafico, la tabella con i dati numerici, un riassunto in linguaggio naturale e una serie di domande con le relative risposte basate su ragionamenti. L’inclusione di questi elementi consente ai modelli di stabilire corrispondenze precise tra le modalità.

Il dataset copre 24 tipi di grafici diversi e utilizza sei librerie di plotting, offrendo una varietà di rappresentazioni più ampia di quanto disponibile in dataset precedenti.

Il paper relativo a questo dataset distingue diversi sottoinsiemi che compongono ChartNet. In primo luogo, ci sono i dati sintetici principali. Per generare questo nucleo, i ricercatori sono partiti da circa 150mila immagini provenienti da TinyChart e hanno ricostruito il codice di ognuna, variandolo iterativamente per ottenere oltre 1,5 milioni di grafici differenti. Questa procedura, basata sulla tecnica del code augmentation, consente di coprire ventiquattro tipi di grafici e sei librerie di plotting, variando colori, tipologie e temi.

A questi si affiancano i dati annotati da esperti. Circa 96.643 grafici sintetici sono stati esaminati e verificati da professionisti che hanno controllato la correttezza semantica e fornito annotazioni di alta qualità.

La collezione comprende anche circa 30mila esempi tratti da fonti come la Banca Mondiale e il Pew Research Center e sottoinsiemi dedicati al grounding e alla sicurezza. Le immagini sono state selezionate per la loro leggibilità e per il rispetto delle regole di copyright, così da permettere di testare la capacità dei modelli di generalizzare anche su dati non sintetici. Un altro segmento contiene 7.000 campioni di addestramento e 600 campioni di test con prompt avversariali su temi sensibili, pensati per verificare e aumentare la robustezza dei modelli.

Questa differenziazione permette di usare ChartNet sia per addestrare modelli generali sia per fine‑tuning su compiti specifici, come il rilevamento di punti chiave in un grafico o l’analisi di grafici su temi sensibili.

Come funziona ChartNet

Per valutare l’efficacia del dataset, i ricercatori hanno addestrato diversi modelli linguistico‑visivi, compresi i modelli Granite Vision di IBM e altri modelli open‑source, su ChartNet e li hanno confrontati con modelli commerciali di dimensioni maggiori. Il risultato principale è che i modelli di piccole e medie dimensioni, se addestrati con ChartNet, superano sistematicamente modelli commerciali molto più grandi in compiti come la ricostruzione del grafico, l’estrazione dei dati, la generazione di sintesi testuali e il question answering.

La ricerca mostra che un dataset di alta qualità conta decisamente di più della dimensione del modello. In alcuni esperimenti, modelli di pochi miliardi di parametri hanno eguagliato o superato le prestazioni di modelli proprietari molto costosi con centinaia di miliardi di parametri.

Il fine‑tuning su ChartNet produce miglioramenti sostanziali per tutte le scale di modelli. Anche i modelli ultra-compatti, inizialmente incapaci di ricostruire un grafico, acquisiscono competenze funzionali dopo il training. I modelli più grandi ottengono miglioramenti notevoli nell’allineamento visivo e nella generazione di codice e presentano elevata accuratezza nell’estrazione dei dati.

Un esempio concreto applicativo è la famiglia di modelli Granite Vision di IBM. La piccola versione 4B, offre prestazioni di livello frontiera nell’estrazione strutturata di documenti (grafici, tabelle e coppie chiave‑valore), con un consumo di risorse molto ridotto. Il modello supporta anche istruzioni dedicate per trasformare un grafico in una tabella CSV o per generare una descrizione naturale.

ChartNet nelle automazioni aziendali

ChartNet è open-source e rappresenta una opportunità concreta per potenziare i processi decisionali con investimenti ridotti. Può essere usato per fine‑tuning di modelli aperti e gratuitamente disponibili, riducendo così le barriere di ingresso. La possibilità di addestrare modelli più piccoli ma accurati consente di implementare soluzioni di analisi dei grafici senza dipendere da fornitori esterni e senza pesare troppo sul budget.

Il dataset offre inoltre flessibilità: si può partire dalle configurazioni generiche di ChartNet per poi aggiungere dati propri, ad esempio grafici dei bilanci aziendali o report di produzione, creando un modello che si adatta perfettamente al contesto specifico dove andrà a operare. La presenza di grafici reali nel dataset e di annotazioni umane di alta qualità consente di evitare che il modello apprenda pattern errati o inferisca correlazioni false quando analizza dati cruciali.

Le catene di ragionamento incluse in ChartNet aiutano i modelli a spiegare i passaggi con cui arrivano a una conclusione. Questa capacità è preziosa per la rendicontazione e il rispetto delle norme, poiché permette agli auditor di verificare come il modello è arrivato a un certo risultato.

Con normative come l’AI Act dell’Unione Europea e la crescente attenzione alla governance dei dati, la trasparenza dei processi decisionali automatizzati diventa una variabile competitiva.

La business intelligence di domani

L’interpretazione di un grafico da parte di un’intelligenza artificiale resta comunque un processo non deterministico; ciò implica che l’automazione può essere un catalizzatore dei processi decisionali, senza tuttavia poterli sostituire per intero in molti domini. In alcuni ambiti particolarmente specialistici, come la bioinformatica, è richiesto anche un ulteriore lavoro di raccolta dati per aggiungere al dataset esempi specifici.

L’automazione e la semplificazione della business intelligence è uno dei tasselli mancanti nella digitalizzazione delle imprese. ChartNet offre una soluzione pragmatica per insegnare a modelli dalle dimensioni modeste a comprendere grafici complessi. Questo significa avere l’opportunità di innovare e automatizzare un processo ostico con costi accessibili, riducendo la dipendenza da soluzioni proprietarie e migliorando l’efficienza nelle analisi di dati.

Il fine-tuning specialistico potrebbe diventare la base di un nuovo ecosistema di strumenti AI leggeri che risolvono problemi specifici. Ogni step evolutivo dell’intelligenza artificiale cambia le modalità con cui applichiamo, nel pratico, le sue capacità. Scegliere la giusta combinazione di strumenti per efficientare i processi resta un compito complesso, che richiede conoscenze specifiche di dominio, padronanza delle tecnologie AI e esperienza nella progettazione di automazioni AI-powered.

Partecipa alla community

guest

0 Commenti
Più recenti
Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati

0
Lascia un commento, la tua opinione conta.x