Può un’AI sostituire un professionista umano su un incarico reale, dall’inizio alla fine? È questa la domanda al centro del Remote Labor Index, uno studio condotto da Scale AI e dal Center for AI Safety per valutare le capacità operative dei principali sistemi di intelligenza artificiale.
I ricercatori hanno raccolto centinaia di progetti pubblicati su piattaforme di freelancing, lavori per i quali persone reali erano state pagate: animazioni 3D di prodotti, trascrizioni musicali, videogiochi web, dashboard interattive, impaginazione di articoli accademici. Ogni incarico è stato poi assegnato a modelli come ChatGPT, Gemini di Google e Claude di Anthropic, senza alcun intervento umano.
Il risultato è netto: il miglior sistema ha completato con successo solo il 2,5% dei progetti. “I modelli attuali non sono nemmeno lontanamente in grado di automatizzare i veri lavori dell’economia”, ha spiegato Jason Hausenloy, uno degli autori dello studio.

Indice degli argomenti:
Errori banali, limiti strutturali
I fallimenti non sono stati marginali. Quasi la metà dei lavori prodotti dall’AI era di scarsa qualità; oltre un terzo è rimasto incompleto. In circa un caso su cinque sono emersi problemi tecnici di base, come file danneggiati o output inutilizzabili.
Secondo i ricercatori, le cause principali sono due. La prima è l’assenza di memoria a lungo termine: i modelli non imparano dagli errori nel tempo, non ricordano feedback ricevuti giorni o settimane prima. La seconda è la debole comprensione visiva, cruciale per attività come grafica, design e modellazione tridimensionale.
Un esempio emblematico è la creazione di una dashboard sul World Happiness Report. Le versioni generate dall’AI apparivano inizialmente corrette, ma un’analisi approfondita ha rivelato dati mancanti, testi sovrapposti e legende con colori sbagliati o assenti.

Il problema degli strumenti (e del giudizio)
Come osserva Graham Neubig, professore alla Carnegie Mellon University, l’AI non utilizza gli stessi strumenti dei professionisti umani. Un designer lavorerebbe con software visivi; un chatbot tenta invece di risolvere il problema scrivendo codice.
Questo riflette il modo in cui i modelli sono addestrati, ma ne evidenzia anche un limite pratico: sanno generare codice, ma faticano a valutare se il risultato finale soddisfi davvero una richiesta. “Il codice è giusto o sbagliato, ma il design visivo è molto soggettivo”, sottolinea Neubig.

Nonostante ciò, i ricercatori notano un miglioramento graduale. Test recenti su Gemini 3 Pro mostrano un tasso di completamento salito all’1,3%, rispetto allo 0,8% della versione precedente. “Le linee di tendenza ci sono”, dice Hausenloy, anche se la sostituzione su larga scala resta lontana.
Perché le soft skill valgono più del codice
Il secondo studio guarda la questione da un’altra angolazione: non cosa l’AI sa fare, ma quali competenze vengono davvero premiate nel mercato del lavoro. Basandosi e aggiornando una celebre analisi del 2017 dell’economista di Harvard David Deming, la ricerca mostra che negli ultimi decenni le abilità sociali hanno generato rendimenti crescenti, superiori a quelli delle competenze puramente matematiche.
L’analisi, estesa fino al periodo 2019–2023, combina dati del censimento statunitense e dell’American Community Survey con informazioni dettagliate sulle competenze richieste dalle diverse professioni. Il risultato è controintuitivo: i lavori che crescono di più in termini di occupazione e salari sono quelli che combinano capacità quantitative e abilità interpersonali come comunicazione, coordinamento, persuasione e negoziazione.
Una svolta storica nel lavoro qualificato
Oggi, professioni con forti soft skill ma poca matematica – come avvocati, terapeuti e infermieri – hanno risultati migliori rispetto a ruoli altamente numerici ma socialmente più isolati, come assistenti statistici o programmatori “puri”. È l’inversione di una tendenza storica: nel 1980 accadeva l’esatto contrario.
Anche all’interno del settore tecnologico, prosperano i ruoli che uniscono programmazione, creatività e collaborazione. Matematici e attuari, con scarso uso di competenze sociali, hanno registrato performance peggiori rispetto agli sviluppatori software, il cui valore risiede spesso nel lavoro di squadra e nella risoluzione creativa dei problemi.
L’AI non elimina il lavoro, lo ridefinisce
Messi insieme, i due studi raccontano una storia coerente. L’AI, oggi, fatica a svolgere lavori complessi in autonomia. Ma allo stesso tempo rende sempre più automatiche e a basso costo le attività quantitative. Questo non cancella i posti di lavoro, ma ne cambia l’economia: un videogioco realizzato da un umano nel test del Remote Labor Index è costato 1.485 dollari; la versione AI – basata su Sonnet – meno di 30.
La vera “AI-proof skill” non è scrivere codice, ma saperlo usare per costruire qualcosa insieme agli altri. In un mercato in cui le funzioni e le formule diventano routine, il valore umano si sposta su ciò che le macchine ancora non sanno fare: capire contesti, collaborare, creare senso.





