L’iniziativa lanciata dal Team della Open Voice Interoperability, sotto l’egida della Linux Foundation AI&Data, rappresenta un significativo passo avanti verso la realizzazione di un ecosistema di intelligenza artificiale aperto e interconnesso.
La rivoluzione delle specifiche Ovon
Nel gennaio 2024, il team Open Voice Interoperability ha annunciato il rilascio di un primo set di specifiche per facilitare le comunicazioni aperte e universali tra diverse AI agency, mirate alla creazione di un framework standardizzato che permetta ai vari assistenti virtuali di “parlare” tra loro con un linguaggio comune.
Questo sforzo mira a superare le barriere esistenti tra le piattaforme di AI, promuovendo un ambiente di cooperazione e interoperabilità senza precedenti.
Le specifiche rilasciate dall’Open Voice Interoperability Team, parte della Linux Foundation AI & Data, includono un concetto di Universal API basato su una “Conversation Envelope specification”, rilasciata pubblicamente su Github e disponibile qui.
Le specifiche in esame definiscono una struttura universale JSON per consentire una interoperabilità di conversazione tra agenti AI, indipendente dai protocolli applicativi che gli sviluppatori desiderano adottare, come ad esempio HTTPS or WebSocket.
I “Dialog events” definiti nella specifica si basano su una struttura dati standard per esprimere eventi linguistici in un sistema di dialogo. Questo consente agli assistenti AI di interagire tra di loro, indipendentemente dalla tecnologia sottostante.
Il 2024 sarà l’anno degli agenti AI specifici
Mentre il 2023 è stato l’anno della ricorsa a modelli di AI Generativa sempre più potenti (GPT-4, Mistral, Anthropic etc…) il 2024 si preannuncia come l’anno che sdoganerà probabilmente i concetti di assistenti o agenti AI specifici e ottimizzati per fornire servizi verticali.
Questi agenti AI specializzati si ritroveranno spesso a dover comunicare fra di loro per fornire un servizio di qualità superiore all’utente: si immagini, ad esempio, un assistente AI che fornisce informazioni generiche (di primo livello) al cittadino di una determinata regione, tramite voicebot o chatbot (sistemi di Conversational AI sempre più adottati).
Ora, supponiamo che a un certo punto della conversazione il cittadino debba poter accedere a dati specifici, magari relativi alla sua situazione previdenziale oppure alla sua cartella clinica.
L’agente AI di primo livello non sarà probabilmente autorizzato a consultare queste informazioni e nemmeno avrà conoscenza su di esse: dovrà quindi “scalare” la comunicazione a una agency di secondo livello, specializzata in questo tipo di servizio e, per poterlo fare, le due agency dovranno comunicare tra di loro.
È proprio qui che intervengono le API universali e le specifiche standard rilasciate dal team della Open Voice Interoperability: agency AI con differenti specializzazioni potranno comunicare tra di loro in maniera standard ed efficace.
Il progetto Bürokratt in Estonia
Le specifiche in questione sono già state testate con successo da alcuni utenti, ad esempio un team specializzato nella digitalizzazione nei paesi Baltici: il progetto Bürokratt dell’Estonia incarna perfettamente l’applicazione pratica di queste specifiche. Con l’obiettivo di rendere i servizi pubblici più accessibili ai cittadini attraverso l’interazione vocale, Bürokratt non si limita a essere un semplice assistente virtuale dello stato estone; piuttosto, è concepito come una rete interoperabile di soluzioni AI sia del settore pubblico che privato. Questo sistema permette agli utenti di accedere a servizi e informazioni pubbliche attraverso un unico canale di comunicazione, semplificando significativamente l’interfaccia tra i cittadini e lo stato.
La realizzazione di Bürokratt, gestita dall’Autorità per i Sistemi Informativi dell’Estonia, dimostra il potenziale delle specifiche di interoperabilità vocale nell’ottimizzare l’efficacia dei servizi pubblici. Testando con successo alcune delle specifiche e delle API rilasciate dalla Open Voice Interoperability, Bürokratt ha stabilito un modello per altre organizzazioni alla ricerca di soluzioni simili per migliorare l’accessibilità e l’efficienza dei loro servizi attraverso la tecnologia vocale.
L’adozione di standard aperti e universali per la comunicazione tra diverse agenzie AI segna un’evoluzione cruciale nel campo dell’intelligenza artificiale. Con il sostegno di iniziative come quella dell’Open Voice Interoperability Team e l’esempio pratico di Bürokratt, si apre la strada verso un futuro in cui le interazioni con la tecnologia AI vocale e messaggistica sono più intuitive, personalizzate e accessibili a un pubblico più ampio. Questo non solo aumenterà l’efficienza e l’efficacia dei servizi offerti ma contribuirà anche a ridurre le barriere digitali, promuovendo un’inclusione più ampia attraverso l’uso dell’AI.
Per maggiori dettagli sull’iniziativa dell’Open Voice Interoperability e su Bürokratt, visita il sito ufficiale di Bürokratt e il repository GitHub dell’Open Voice Interoperability.