Del debutto di GPT-5 si è molto parlato. La nuova versione del modello di OpenAI è stata vista da una parte degli utenti come un deciso salto in avanti, ma è stata anche criticata da molti altri. Le accuse più frequenti riguardano risposte “pigre”, un calo nella creatività, una sorta di cautela eccessiva negli output che sembra limitarne la capacità generativa.
Per chi usa questi strumenti in azienda, le valutazioni sul nuovo modello sono indispensabili per capire se vale la pena investire tempo, formazione e risorse per integrare GPT-5 nei propri processi. Per questo bisogna andare oltre il dibattito sul web e sottoporre GPT-5 a un vero e proprio stress test.
Abbiamo costruito tre scenari di lavoro realistici, complessi e multidisciplinari, pensati per esplorare i limiti del modello e capire dove si colloca il suo valore pragmatico.
Per tali test abbiamo individuato prompt concisi e specifici, che consentissero di analizzare criticamente le risposte generate dal modello, per valutarne i punti di forza e le sue debolezze, in vista di un’adozione in uno scenario professionale. L’obiettivo era fornire un verdetto chiaro sul suo reale valore strategico, un’analisi che potesse guidare le decisioni di investimento di chi, ogni giorno, deve fare i conti con il mercato.

Indice degli argomenti:
Scenario 1: analisi di dati non strutturati
I workflow digitali del mondo reale sono spesso un campo di battaglia. Email, report, trascrizioni, chat e altre sorgenti dati generano un flusso disorganizzato di informazioni che può nascondere al suo interno opportunità di profitto e minacce. Saperle estrarre e correlare rapidamente è un vantaggio competitivo enorme. Ma chi ha il tempo?
Abbiamo simulato una delle situazioni più comuni e dispendiose in termini di tempo: la necessità di aggregare fonti diverse per ottenere un quadro d’insieme. Abbiamo fornito a GPT-5 un set di documenti volutamente eterogenei:
- un verboso report tecnico di 15 pagine su un nuovo prodotto software, completo di bug noti e feedback frammentari dei beta tester;
- una caotica ma rivelatrice catena di email tra il team marketing e quello di sviluppo;
- la trascrizione (imperfetta) di una riunione del comitato direttivo in cui si discuteva del budget trimestrale. Un groviglio di dati che richiederebbe ore di lavoro a un analista umano.
Il prompt
“Agisci come un analista strategico senior. Analizza i tre documenti allegati e produci una sintesi strategica in formato ‘memo per il CEO’ di massimo 500 parole. La sintesi deve obbligatoriamente includere:
1. Le tre priorità operative più urgenti per la prossima settimana, ordinate per impatto.
2. Una valutazione dei due rischi futuri più significativi (sia a livello di prodotto che di mercato) che emergono dai documenti.
3. Una raccomandazione concreta su come allocare un budget di emergenza di 50.000 euro per mitigare i rischi identificati.
Analisi dei risultati
Punti di forza:
- Velocità: la generazione del risultato ha richiesto soltanto 48 secondi dal termine dell’upload, un tempo soddisfacente per la produzione del memo.
- Correlazione: il modello è stato in grado di trovare il “filo rosso” nel caos, correlando con successo un bug tecnico specifico menzionato a pagina 5 del report con una lamentela del team marketing in una email.
- Struttura e chiarezza: Il formato “memo per il CEO” è stato rispettato. La risposta generata ha un linguaggio formale, diretto, e organizzato in punti chiari e concisi.
Debolezze:
- Profondità di analisi: Qui emerge un primo limite sostanziale. La valutazione dei rischi ha identificato il “cosa” (es. “rischio di danno reputazionale dovuto al bug”), ma non ha esplorato a fondo ragioni e implicazioni di questo rischio. Il memo non è quindi sufficiente a fornire un quadro davvero completo della situazione.
- Concretezza delle raccomandazioni: la proposta di allocazione del budget era eccessivamente generica: “investire nello sviluppo per risolvere il bug e migliorare i processi di comunicazione interna”. Una raccomandazione che non può essere definita operativa, perché manca il piano di azione, ovvero chi fa cosa e quando.
Il verdetto
GPT-5 si è dimostrato un buono strumento per una prima bozza di analisi, che permetta al management di individuare quali punti approfondire per arrivare a una decisione operativa. Resta indispensabile una supervisione analitica umana per aggiungere profondità e granularità strategica al contenuto AI-generated.
Scenario 2: generazione di contenuti cross-media
Creare una campagna di comunicazione coerente sul blog e sui diversi social media è un’attività time-consuming per tutti i team di marketing. Bisogna ideare, produrre e garantire che la brand identity traspaia su ogni canale scelto. Abbiamo chiesto a GPT-5 di agire come un content manager per testare la sua capacità di orchestrare una mini-campagna partendo da un singolo brief conciso, valutandone la coerenza del messaggio e l’intelligenza nell’adattamento ai diversi formati.
Il prompt
“Sei il responsabile comunicazione di ‘Green Natura’, un’azienda di fertilizzanti organici. Il nuovo prodotto ‘BioForza Plus’ ha una formula a lento rilascio che nutre le piante per 3 mesi. Il nostro target sono giovani appassionati di giardinaggio urbano (25-40 anni). A partire da queste informazioni, genera:
1. Un articolo per il blog di 800 parole dal titolo ‘Il segreto per un pollice verde in città (anche se te ne dimentichi)’.
2. Tre post per Instagram, completi di caption, hashtag pertinenti e descrizione dell’immagine.
3. Lo script per un video TikTok di 30 secondi che mostri il ‘prima e dopo’ di una pianta, con indicazioni per la voce fuori campo e testo in sovrimpressione.”
Analisi dei risultati
Punti di forza:
- Coerenza interna: il messaggio principale della campagna è stato comunicato in modo efficace in tutti i contenuti generati. Il messaggio di fondo era sempre lo stesso, solido e riconoscibile.
- Adattamento al canale: L’output ha rivelato una comprensione delle “grammatiche” di ogni piattaforma. L’articolo per il blog era ben strutturato in paragrafi, con sottotitoli e un approccio SEO-oriented. I post suggeriti per Instagram mostravano visivamente il prodotto, con caption brevi e un paio di emoji a spezzare il ritmo del testo. Lo script per TikTok era concreto, con indicazioni rapide su come usare il prodotto e testi in sovrimpressione per catturare l’attenzione.
Debolezze:
- Linguaggio: sebbene la struttura fosse eccellente, il tono di voce era troppo “AI-Generated”. Il testo conteneva troppe frasi che suonano come cliché del marketing digitale: “porta il tuo giardinaggio al livello successivo”, “scopri il segreto per piante rigogliose”, “una vera rivoluzione per i tuoi vasi”. Mancava un tocco di unicità.
- Creatività standard: le idee erano buone, ma non particolarmente originali. Il modello non è stato in grado di suggerire una creatività disruptive, con il potenziale per rendere la campagna indimenticabile.
Il verdetto
La generazione di contenuti può essere un acceleratore di produzione, ma necessita un deciso intervento umano nel suggerire spunti creativi ben precisi in fase di prompt e nella rifinitura stilistica dei contenuti.

Scenario 3: risoluzione di problemi interdisciplinari
I problemi reali raramente sono semplici e quasi sempre interdisciplinari, e richiedono di bilanciare vincoli matematici, normative e creatività. Abbiamo inventato uno scenario per costringere il modello a integrare competenze radicalmente diverse per fornire una soluzione operativa praticabile.
Il prompt
“Agisci come consulente per una startup di food delivery. Dobbiamo lanciare un concorso a premi in Italia. Progetta l’intera iniziativa rispettando i seguenti vincoli:
1. Vincolo matematico: il montepremi totale non deve superare i 10mila euro. La struttura dei premi deve massimizzare il numero di vincitori per aumentare la percezione di vincita e la partecipazione.
2. Vincolo normativo: il concorso deve essere pienamente conforme alla normativa italiana sui concorsi a premi (DPR 430/2001), menzionando gli adempimenti burocratici chiave da non dimenticare.
3. Vincolo creativo: Il nome del concorso deve essere accattivante e legato al mondo del cibo. Il meccanismo di partecipazione deve essere semplice e incoraggiare la viralità sui social.”
Analisi dei risultati
Punti di forza:
- Integrazione: la capacità di GPT-5 di gestire requisiti moto diversi tra loro è stata evidente. Il sistema ha proposto una struttura di premi intelligente, rispettando il budget e la logica di massimizzazione dei vincitori. Ha ideato un meccanismo semplice ma efficace (ogni ordine effettuato sull’app costituisce una partecipazione, con partecipazioni extra per chi condivide sui social).
- Normativa: L’AI ha generato un riassunto abbastanza completo degli step normativi principali: la necessità di redigere un regolamento ufficiale, la comunicazione al Ministero delle Imprese e del Made in Italy (ex MISE), il versamento della cauzione e l’obbligo di estrazione alla presenza di un notaio o funzionario della Camera di Commercio.
Debolezze:
- Rischio di imprecisioni legali: sebbene la checklist fosse corretta nelle sue linee generali, non è stato inserito nessun disclaimer che consigli di consultare un legale. Questo è estremamente pericoloso: affidarsi ciecamente a un’AI per questioni legali è pericolosissimo, e l’utente dovrebbe essere sempre avvisato di ciò.
- Comunicazione: l’AI ha dedicato al marketing dell’iniziativa una piccolissima lista in calce al testo generato. Non è assolutamente sufficiente; il piano di promozione dell’iniziativa doveva essere uno dei cardini della strategia richiesta dall’utente.
Il verdetto
L’AI ha risposto al prompt affrontando le varie declinazioni del problema in modo uniforme ma non esaustivo. Il contenuto fornito può essere uno strumento di brainstorming molto efficace, ma la sua affidabilità in ambiti specialistici deve essere considerata nulla senza la validazione di un professionista.
Conclusione: usare GPT-5 in azienda
Le voci negative su GPT-5 hanno dunque un fondo di verità? La risposta è parzialmente sì, ma solo se lo si valuta per ciò che non è: un sostituto del pensiero critico e dell’esperienza umana.
Le critiche sulla pigrizia del modello nascono da un’aspettativa errata. GPT-5 non si comporta come uno yes-man ed è progettato per risposte più concise e dirette rispetto ad alcuni dei suoi predecessori, soprattutto quelli che applicavano sempre il deep-thinking, anche quando non era necessario.
Il nuovo modello può diventare un acceleratore di produttività e, con il prompt giusto, può supportare l’analisi documentale e il brainstorming. Manca ancora della profondità strategica, della creatività e dell’affidabilità specialistica di un esperto di settore. I contenuti generati possono essere una buona base di partenza per velocizzare e potenziare molti workflow aziendali.






