approfondimento

Cos’è il riconoscimento vocale e come funziona



Indirizzo copiato

Questa tecnologia è diventata sempre più comune nella vita quotidiana, grazie alla sua presenza in assistenti virtuali come Siri, Alexa e Google Assistant, e in molte altre applicazioni e dispositivi. Buona parte del suo successo e della sua efficacia è dovuta allo sviluppo dei Large Language Model (LLM) e all’AI generativa

Pubblicato il 5 mar 2025

Paolo Dotti

Quence – TXTGROUP



riconoscimento vocale

Il riconoscimento vocale è una tecnologia che permette a un dispositivo di capire ciò che viene detto da una persona attraverso la voce. In altre parole, è un sistema che consente di trasformare le parole pronunciate in testo o in comandi che il dispositivo può eseguire. Già nello scorso millennio la ricerca per il riconoscimento vocale era diffusa, i risultati crescevano di pari passo con le prestazioni dei processori e l’implementazione di algoritmi, dal Machine learning agli Hidden Markov Models. Lo scopo primario era tradurre la voce in testo; si parla di ASR (Automatic Speech Recognition). C’è anche la corrispondente operazione inversa, i TTS (Text To Speech) per produrre un output voce da un testo.

Continua a leggere questo articolo

Articoli correlati