studio mIT MEDIA LAB

Usare troppo gli LLM fa aumentare il debito cognitivo del cervello



Indirizzo copiato

Un recente studio del MIT evidenzia il costo cognitivo dell’uso degli LLM per scrivere saggi. I partecipanti che hanno usato l’AI mostrano minore attivazione cerebrale, scarsa memorizzazione e ridotta percezione di proprietà dei loro elaborati, suggerendo un potenziale calo delle capacità di apprendimento a lungo termine. Si evidenzia la necessità di un approccio equilibrato

Pubblicato il 25 giu 2025



MIT LLM debito cognitivo

L’ampia adozione di modelli linguistici di grandi dimensioni (LLM) come ChatGPT sta trasformando ogni aspetto della nostra vita, inclusi il lavoro, il gioco e l’apprendimento. Se da un lato questi sistemi offrono capacità senza precedenti per personalizzare le esperienze di apprendimento, fornire feedback immediati e democratizzare l’accesso alle risorse educative, dall’altro emergono preoccupazioni critiche sulle implicazioni cognitive dell’uso estensivo degli LLM. Mentre possono ridurre il carico cognitivo immediato, potrebbero simultaneamente diminuire le capacità di pensiero critico e portare a un minor coinvolgimento nei processi analitici profondi.

Uno studio del MIT Media Lab (Nataliya Kosmyna, Eugene Hauptmann, Ye Tong Yuan, Jessica Situ, Xian-Hao Liao, Ashly Vivian Beresnitzky, Iris Braunstein, Pattie Maes) dal titolo “Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Taskesplora il costo cognitivo derivante dall’uso di un LLM per la scrittura di un saggio, un compito cognitivamente complesso che attiva molteplici processi mentali.

La ricerca del MIT sul debito cognitivo: i gruppi a confronto

La ricerca ha coinvolto 54 partecipanti di età compresa tra 18 e 39 anni, reclutati da cinque università dell’area metropolitana di Boston. I partecipanti sono stati assegnati casualmente a tre gruppi per le prime tre sessioni, svoltesi nell’arco di quattro mesi:

  • Gruppo LLM: utilizzava esclusivamente OpenAI GPT-4o per la scrittura dei saggi.
  • Gruppo motore di ricerca: poteva usare qualsiasi sito web (principalmente Google, con ricerche che escludevano risultati AI).
  • Gruppo “cervello-solo” (brain-only): non poteva utilizzare alcun supporto online o LLM, affidandosi unicamente alle proprie conoscenze.

In una quarta sessione opzionale, 18 partecipanti sono stati riassegnati ai gruppi opposti (ad esempio, gli ex-LLM sono diventati “LLM-a-Cervello” e gli ex-Cervello-solo sono diventati “Cervello-a-LLM”) e hanno riscritto saggi su argomenti già affrontati. Sono state raccolte registrazioni dell’attività cerebrale tramite elettroencefalografia (EEG) per valutare l’impegno e il carico cognitivo, oltre ad analisi NLP dei saggi e interviste post-sessione.

La connettività neurale: differenze profonde

L’analisi EEG ha fornito prove robuste che i gruppi LLM, Motore di Ricerca e Cervello-solo avevano schemi di connettività neurale significativamente diversi, riflettendo strategie cognitive divergenti. La connettività cerebrale si è ridotta sistematicamente con la quantità di supporto esterno:

  • Il gruppo Cervello-solo ha mostrato le reti più forti e più estese, con una connettività neurale più elevata in tutte le bande di frequenza (alfa, beta, delta, theta). Ciò suggerisce un maggiore coinvolgimento dei processi interni come l’ideazione creativa, l’elaborazione semantica, la memoria di lavoro e il controllo esecutivo.
  • Il gruppo Motore di ricerca ha mostrato un impegno intermedio, con una connettività totale inferiore del 34-48% rispetto al gruppo Cervello-solo. Hanno evidenziato una maggiore attività nelle cortecce occipitali e visive, riflettendo l’impegno nella ricerca visiva e nella valutazione delle informazioni presentate sullo schermo.
  • L’assistenza LLM ha elicitato l’accoppiamento complessivo più debole, con una connettività ridotta fino al 55% rispetto al gruppo Cervello-solo. La loro minore connettività nelle bande theta e alfa indica un onere ridotto della memoria di lavoro e del controllo esecutivo, presumibilmente perché il bot forniva supporto cognitivo esterno.

In sintesi, la scrittura senza assistenza ha aumentato le interazioni della rete cerebrale in più bande di frequenza, mentre l’assistenza AI ha ridotto la connettività neurale complessiva e ha modificato le dinamiche del flusso di informazioni.

LLM MIT debito cognitivo
Percentuale di soddisfazione dichiarata dai partecipanti per ciascun gruppo in merito al saggio scritto dopo la Sessione 1

Conseguenze comportamentali: memoria e proprietà

I dati comportamentali hanno rafforzato le scoperte neurali:

  • Capacità di citazione e memorizzazione: gli utenti LLM hanno mostrato una significativa compromissione nella capacità di citare i propri saggi, con l’83% dei partecipanti che ha riportato difficoltà nella Sessione 1, e nessuno che ha fornito citazioni corrette. Questa compromissione è persistita anche nelle sessioni successive. I gruppi Motore di ricerca e Cervello-solo non hanno mostrato tali problemi, raggiungendo quasi la perfezione nella Sessione 2. Questo suggerisce un processo di codifica della memoria superficiale quando si utilizzano gli LLM, bypassando i processi di codifica profonda.
  • Percezione di proprietà del saggio: Il gruppo Cervello-solo ha rivendicato la piena proprietà dei propri testi quasi all’unanimità (16/18 nella Sessione 1). Il gruppo LLM, invece, ha presentato un senso di autorialità frammentato e in conflitto, con alcuni che rivendicavano la piena proprietà, altri che la negavano esplicitamente e molti che si attribuivano un credito parziale (es. 50-90%). Questo suggerisce un senso diminuito di agenzia cognitiva a causa della delega della generazione di contenuti ai sistemi esterni.

Analisi linguistica (NLP): omogeneità e bias

L’analisi NLP ha rivelato che il gruppo LLM ha prodotto saggi statisticamente omogenei all’interno di ogni argomento, mostrando una deviazione significativamente inferiore rispetto agli altri gruppi. Il gruppo Cervello-solo, al contrario, ha mostrato una forte variabilità. Il gruppo LLM ha utilizzato il maggior numero di entità nominate (NER) specifiche (persone, luoghi, anni), mentre il gruppo Motore di ricerca ne ha usate almeno due volte meno, e il gruppo Cervello-solo il 60% in meno.

Si è osservato che i saggi generati con l’aiuto degli LLM potevano propagare i bias presenti nei dati di addestramento, e gli utenti dei motori di ricerca potevano essere suscettibili alle bolle di filtro. Il gruppo LLM mostrava una maggiore probabilità di usare forme di terza persona e di concentrarsi su aspetti legati alla carriera (“choos career”).

Le riassegnazioni della sessione 4: adattamento cognitivo

La Sessione 4 ha offerto intuizioni cruciali sull’adattamento cognitivo:

  • Gruppo LLM-a-Cervello: i partecipanti che in precedenza avevano usato gli LLM hanno mostrato una connettività neurale più debole e un sotto-impegno delle reti alfa e beta quando sono stati chiamati a scrivere senza strumenti. Hanno riutilizzato il vocabolario e la struttura specifici dell’LLM delle sessioni precedenti, indicando un bias residuo. La loro connettività, sebbene migliorata rispetto a una prima prova, non ha raggiunto i livelli di integrazione profonda osservati nel gruppo Cervello-solo. Questo suggerisce che la precedente esposizione all’IA potrebbe aver limitato lo sviluppo di strategie organizzative interne.
  • Gruppo Cervello-a-LLM: i partecipanti che in precedenza avevano scritto senza strumenti, quando è stato loro permesso di usare un LLM, hanno mostrato un aumento significativo della connettività cerebrale in tutte le bande di frequenza. Questo picco di connettività a livello di rete indica elevati livelli di integrazione cognitiva, riattivazione della memoria e controllo top-down, suggerendo che l’introduzione dell’AI in un flusso di lavoro endogeno ha costretto il cervello a conciliare piani interni con suggerimenti esterni. Hanno anche mostrato una maggiore capacità di richiamo della memoria.

Questi risultati implicano che l’AI può alleggerire alcuni processi cognitivi, ma allo stesso tempo introduce nuove richieste decisionali.

LLM MIT debito cognitivo

Questa figura presenta le distanze PaCMAP medie normalizzate tra i saggi della quarta sessione e i saggi
delle sessioni precedenti (dalla prima alla terza) per lo stesso partecipante e argomento. L’asse Y mostra le distanze PaCMAP medie normalizzate che rappresentano il grado di cambiamento nel contenuto e nella struttura dei saggi tra la quarta sessione e quelle precedenti.
L’asse X mostra la direzione del cambiamento della sessione, classificata in base agli strumenti di scrittura utilizzati per creare i saggi.

Debito cognitivo e implicazioni future

Lo studio dimostra che l’uso degli LLM ha avuto un impatto misurabile sui partecipanti: mentre i benefici erano inizialmente apparenti, il gruppo LLM ha mostrato prestazioni inferiori rispetto al gruppo Cervello-solo a tutti i livelli: neurale, linguistico e di punteggio. La ripetuta dipendenza da sistemi esterni come gli LLM può sostituire i processi cognitivi faticosi necessari per il pensiero indipendente, portando all’accumulo di “debito cognitivo”. Questo debito, sebbene riduca lo sforzo mentale a breve termine, comporta costi a lungo termine come la diminuzione del pensiero critico, una maggiore vulnerabilità alla manipolazione e una ridotta creatività.

I docenti umani, a differenza del giudice AI, sono stati in grado di riconoscere i saggi generati dagli LLM, notando una struttura convenzionale e l’omogeneità dei punti. L’esperienza di “sentirsi in colpa” per l’uso dell’AI e la bassa percezione di proprietà degli elaborati da parte degli utenti LLM evidenziano un disagio etico persistente.

LLM MIT debito cognitivo
La lunghezza media delle frasi e delle parole per gruppo. Lunghezza del saggio per gruppo in numero di parole.

Conclusioni

In conclusione, questo studio del Mit Media Lab funge da guida preliminare per comprendere gli impatti cognitivi e pratici dell’AI negli ambienti di apprendimento. È importante che le future strategie educative combinino l’assistenza degli strumenti AI con fasi di apprendimento senza strumenti per ottimizzare sia il trasferimento immediato delle competenze che lo sviluppo neurale a lungo termine. Saranno necessari studi longitudinali per comprendere l’impatto a lungo termine degli LLM sul cervello umano.

Lo studio integrale del MIT Media Lab è disponibile qui

Articoli correlati

Articolo 1 di 4