L’audio, ultima frontiera dell’intelligenza artificiale. Negli ultimi mesi, OpenAI ha lavorato per rendere gli agenti testuali più intelligenti, capaci e utili con il rilascio di strumenti come Operator, Deep Research, Computer-Using Agents e l’API Responses con strumenti integrati. Tuttavia, per rendere gli agenti davvero efficaci, è fondamentale permettere interazioni più profonde e intuitive, che vadano oltre il semplice testo. “Usare il linguaggio parlato naturale per comunicare in modo efficace” è il prossimo passo.
tecnologia
OpenAI rende disponibili via API modelli vocali di nuova generazione
Lanciata una nuova suite di modelli audio che potenziano le capacità degli agenti vocali. Con progressi significativi nel riconoscimento e nella sintesi vocale, questi strumenti offrono esperienze utente più naturali, personalizzabili e intelligenti. Disponibili per gli sviluppatori di tutto il mondo

Continua a leggere questo articolo
Aziende
Argomenti
Canali