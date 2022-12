Pierluigi Sandonnini giornalista

OpenAI, la società che sta dietro AlphaFold e GPT-3, ha presentato un nuovo modello linguistico: ChatGPT. Si tratta di un chatbot progettato per rispondere alle domande, ma può anche essere utilizzato per eseguire il debug del codice.

La società sostenuta da Microsoft ha sviluppato un modello linguistico di grandi dimensioni progettato per interagire con gli utenti in “modo colloquiale”.

OpenAI afferma che il formato di dialogo del modello consente a ChatGPT di rispondere a domande di follow-up, ammettere i propri errori, sfidare premesse errate e rifiutare richieste inappropriate.

ChatGPT è un modello di pari livello di InstructGPT, rilasciato a gennaio e progettato per fornire una risposta dettagliata a un’istruzione in un prompt.

Gli utenti di Internet possono provare ChatGPT gratuitamente durante la fase di anteprima della ricerca. Per accedere al modello, gli utenti devono creare un account OpenAI e devono dichiarare di avere almeno 18 anni.

Come funziona ChatGPT?

ChatGPT è stato costruito utilizzando l’apprendimento per rinforzo dal feedback umano (RLHF). Il metodo è progettato per eliminare le risposte errate premiando le risposte corrette mentre corregge quelle che non lo sono.

ChatGPT differisce da InstructGPT in quanto un modello iniziale è stato addestrato utilizzando la messa a punto supervisionata: i formatori di AI umani hanno fornito conversazioni in cui hanno giocato sia l’utente che un assistente AI. I formatori hanno avuto accesso a suggerimenti scritti su modelli per aiutarli a comporre le loro risposte.

Il modello stesso è stato costruito e messo a punto con GPT-3.5, una versione rivista del modello di punta di OpenAI che condivide il suo nome ma è costruito per essere migliore nella generazione di testo dettagliato. Sia ChatGPT che GPT 3.5 sono stati addestrati su un’infrastruttura di supercomputing di intelligenza artificiale di Azure, che Microsoft ha creato in collaborazione con OpenAI a maggio 2020.

Quanto è efficace ChatGPT?

ChatGPT è effettivamente un chatbot e come altri è soggetto a generare “output offensivo”, come nel caso di BlenderBot 3 di Meta. OpenAI afferma di aver preso lezioni dai modelli precedenti, come GPT-3 e Codex, per cercare di migliorare l’affidabilità di ChatGPT, incluso l’utilizzo della sua tecnica di apprendimento per rinforzo per ottenere “sostanziali riduzioni di output dannosi e non veritieri”.

Tuttavia, l’azienda di intelligenza artificiale riconosce che il suo modello ha dei limiti. Ad esempio, a volte scrive risposte plausibili ma errate o senza senso.

Il modello è anche prolisso e abusa di alcune frasi, come riaffermare che si tratta di un modello linguistico addestrato da OpenAI – che secondo la società deriva da pregiudizi nei dati di addestramento.

“Abbiamo fatto molti sforzi per far sì che il modello rifiuti richieste inappropriate, ma a volte risponderà a istruzioni dannose o mostrerà comportamenti distorti”, ha detto OpenAI. “Stiamo usando l’API di moderazione per avvisare o bloccare determinati tipi di contenuti non sicuri, ma ci aspettiamo ancora alcuni falsi negativi e positivi”.

Per affrontare i limiti del modello, OpenAI ha dichiarato di volersi impegnare a fare aggiornamenti regolari per migliorarlo e che lavorerà anche per fornire un’interfaccia accessibile.

Le reazioni

Come per ogni nuova versione di modello, la comunità AI ha reagito in modi molto diversi.

Alcuni hanno chiesto a ChatGPT di generare prompt per generatori di testo-immagine, come MidJourney o Stable Diffusion, e li hanno utilizzati su questi modelli.

La prof.ssa Emily M. Bender, direttrice del Computational Linguistics Laboratory dell’Università di Washington, ha ricordato che ChatGPT “è ancora solo un modello linguistico: solo una macchina di sintesi testuale / generatore casuale di BS”.

Pochi giorni dopo il rilascio del modello, StackOverflow, il sito di domande e risposte dei programmatori, ha temporaneamente vietato agli utenti di pubblicare risposte generate da ChatGPT, dicendo che il volume di risposte errate ma plausibili era troppo grande.